Данные
Данные содержат изображения из объявлений, размещенных на сайте:
- Обучающая выборка (выборка А): содержит 41 122 изображения, классифицированных на два класса (1 — в изображении присутствует контактная информация, 0 — в изображении отсутствует контактная информация). Выборка A используется для настройки алгоритмов участниками.
- Тестовая выборка (выборка В): содержит 10 000 изображений; используется для составления промежуточного рейтинга участников, который обновляется два раза в неделю.
- Контрольная выборка (выборка С): содержит 10 000 изображений; предоставляется участникам на втором этапе конкурса и используется для определения победителей конкурса.
Изображения имеют формат jpg, ответы по обучающей выборке представлены в csv-файле в формате Id, label, где Id — имя файла изображения, а label — метка класса, 0 или 1.
Название файла | Описание файла |
---|---|
Выборка А (train) | обучающая выборка, содержит изображения в формате jpg |
Выборка В (test) | тестовая выборка, содержит изображения в формате jpg |
Выборка С (control) | контрольная выборка, содержит изображения в формате jpg |
Метки классов объектов обучающей выборки | csv-файл содержит метки классов для выборки A |
Метки классов объектов тестовой выборки | csv-файл содержит метки классов для выборки В |