Важной частью информации о товаре являются его свойства (например, «материал») и значения («искусственная кожа»). Проблема в том, что у продавца и у Ozon они могут называться по-разному (не «искусственная кожа», а «кожзам»).
Наша задача в рамках машинного обучения — понять, что это одно и то же. Для этого система анализирует «близость» с точки зрения языка свойств и значений.
Преобразование детальной информации о товаре
Вся информация о товаре разбивается на свойства (например, «материал») и значения («искусственная кожа»). Проблема в том, что у продавца и у Ozon они могут называться по-разному (не «искусственная кожа», а «кожзам»).
Наша задача в рамках машинного обучения — понять, что это одно и то же. Для этого система анализирует свойства и значения в числовом формате и мэтчит их с параметрами Ozon. В результате мы из сырых данных получаем табличку с необходимым для публикации контентом