Магазин датасетов
При запуске проекта на основе нейросетей требуется большое количество данных
для машинного обучения. Из-за временных и бюджетных ограничений команда разработчиков сталкивается с проблемой получения данных для обучения системы. Компания «Геодата» поможет быстро, качественно и надежно собрать необходимое количество данных под конкретную задачу.
Датасет разметки поясничного и шейного отдела позвоночника.
На сагиттальных снимках размечены: позвонки, остеофиты, крестец, диски, грыжи дисков, грыжи Шморля, спинномозговой канал, спинной мозг, конский хвост (нити), остистые и верхние суставные отростки.

На аксиальных снимках размечены: позвонки, грыжи диска, Артерии, вена, спинномозговой канал, дуральный мешок, спинной мозг, нервные корешки, нервы, латеральные пространства, межпозвонковые отверстия, фасет, ножки фасета, межпозвонковые суставы (суставные щели), нижние суставные отростки (шапочки фасета), желтые связки, почки.

Кол-во данных:
  • более 10 тыс. сагиттальных изображений
  • и 5 тыс. аксиальных изображений
Разметка адресов в тексте.
название страны, региона, субъекта, населенного пункта, метро, улица, дома, квартиры и т.д.

Кол-во данных:
  • более 10 тыс. текстов.
Датасет разметки токсичных диалогов.
Диалоги размечены на следующие классы: деструктив отвечающего; конфликт; спасение отвечающего; обычная коммуникация; коммуникация отсутствует (например, реакция или комментарий на новость).

Кол-во данных:
  • более 10 тыс. диалогов.
Датасет разметки комментариев о продукте покупателем.
Разметка текста на классы: аспект (особенность продукта, о котором идет речь в отзыве), мнение (характеристика аспекта, данная автором отзыва), тональность аспекта (отношение пользователя к определенному аспекту продукта, которая может быть положительной, нейтральной и отрицательной и определяется мнением покупателя).

Кол-во данных:
  • более 10000 отзывов, состоящих из 250 символов.
Датасет разметки вывесок, логотипов и брендов.
  • Кол-во данных: более 5 тыс. изображений.
Датасет разметки аудио данных.
Аудиофайл формата WAV, MP3 с расставленными метками шумов и посторонних звуков.

  • Кол-во данных: более 100 тыс. часов аудио.
Датасет разметки изображений камер наружного наблюдения.
Разметка включает в себя: идентификацию камер наружного наблюдения и классификацию камер на типы.

  • Кол-во данных: более 10 тыс. изображений.
Датасет разметки изображений малых архитектурных форм.р наружного наблюдения.
Разметка и идентификация объектов: определение типов малых архитектурных форм на изображении (колонны и сферы)

  • Кол-во данных: более 10 тыс. изображений.
Датасет разметки изображений табличек парковки.
Разметка табличек парковки по контуру.

  • Кол-во данных: более 10 тыс. изображений.
Датасет транскрибации аудио данных.
Аудиофайл формата WAV, MP3 с текстовым файлом формата txt.

  • Кол-во данных: более 100 тыс. часов аудио.
Техника
Датасет представляет собой набор изображений дорог, снятых с высоты полета.
Изображения содержат дороги разных типов и размеров, включая автомагистрали, шоссе, городские улицы и проселочные дороги, собранных с помощью аэрофотосъемки. Каждое изображение в датасете имеет следующую разметку: позиция дороги: координаты левого верхнего и правого нижнего углов прямоугольника, охватывающего дорогу на изображении, тип дороги: классификация дороги (автомагистраль, шоссе, городская улица или проселочная дорога).

  • Кол-во данных: более 10 тыс. изображений.
Видео
Датасет содержит видеозаписи различных событий и действий.
Датасет состоит из видео, каждое из которых имеет продолжительность от 1 до 5 минут, снятых в различных условиях освещения, погоды и времени суток. Для каждого видео в датасете была выполнена следующая разметка: разметка объектов: идентификация всех объектов на видео и их классификация (люди, автомобили, здания и т.д.), определение действий: для каждого объекта на видео определяется выполняемое действие (идет, бежит, стоит и т.п.), классификация видео: все видео в датасете классифицированы на несколько категорий (городские сцены, дорожные сцены, спортивные события и т.д.).

  • Кол-во данных: более 10 тыс. видео.
Датасет изображений оружия в руках
Датасет состоит из набора изображений, на которых люди держат различные виды оружия. Датасет содержит аннотированные изображения, размеченные с помощью прямоугольных рамок вокруг оружия в руках людей, с указанием вида оружия (пистолет, винтовка).

  •  Кол-во данных: более 10 тыс. изображений.
Face ID
Датасет состоит из изображений лиц людей разного пола, возраста и выражающих различные эмоции.
Все изображения были аннотированы по полу, возрасту и эмоциям, каждое изображение имеет следующую разметку: пол: мужской или женский, возраст: числовой атрибут от 10 до 100, обозначающий возраст человека на изображении, эмоции: набор из семи эмоций (радость, грусть, гнев, страх, удивление, отвращение, нейтральное), которые были выражены на лице человека на изображении.

  • Кол-во данных: более 10 тыс. изображений
Нашивки / Медали
Датасет содержит изображения нашивок и медалей различных форм и размеров.
Все изображения в датасете имеют следующую разметку: форма: координаты вершин многоугольника, описывающего форму нашивки или медали, размер: ширина и высота нашивки или медали в пикселях, категория: тип нашивки (военная, спортивная, государственная и т. д.) или вид медали (орден, медаль и т. д.)

  • Кол-во данных: более 10 тыс. изображений.
{ Наши инструменты }