технологии. проекты. события

оперативно. предметно. ответственно
Истории успеха
Истории успеха Опубликовано

Immobilien Scout 24: Применение автоматического интеллектуального анализа данных для больших массивов документов

Немецкий портал объявлений о сделках с недвижимостью Immobilien Scout 24 использует технологии InterSystems для автоматического интеллектуального анализа неструктурированных данных.

Заказчик: ImmobilienScout24
Партнер:  Компания n3 («n в кубе»)
Технологии: Intersystems Caché (с поддержкой InterSystems iKnow), InterSystems Ensemble

 

О заказчике

ImmobilienScout24 — крупнейший интернет-портал объявлений о недвижимости на немецком языке. Ежемесячно его посещают более 10 миллионов пользователей.

Центральный офис компании, насчитывающей более 600 сотрудников, расположен в Берлине.

ImmobilienScout24 входит в состав Scout24 Group — дочерней компании Deutsche Telekom.

Два года назад компания поставила задачу перевести все действия по подбору недвижимости на электронную площадку, обеспечив высокое качество размещаемой информации и добавив электронные сервисы по оценке стоимости недвижимости.

 

Оценка стоимости недвижимости через портал

Уникальным предложением портала, несомненно, привлекательным для продавцов и покупателей, является возможность оценки стоимости недвижимости через Интернет. Это кnow how компании ImmobilienScout24. Потенциальные покупатели, продавцы или риэлторы могут использовать этот инструмент для определения текущей рыночной стоимости выбранной недвижимости, а также для обзора цен в заданном регионе. Такой подход обходится значительно дешевле профессиональной оценки внешними экспертами.

При оценке через Интернет используется так называемый метод сравнения продаж: изначально в базе данных ImmobilienScout24 определяется не менее десяти объектов недвижимости, стоимость которых сравнима со стоимостью оцениваемого. Эти объекты должны относиться к одному типу (например, частный дом, квартира) и располагаться в том же районе.

Различия в деталях помогает учитывать система надбавок и скидок. После этого скорректированные значения сравниваемых объектов усредняются, что позволяет сделать обоснованное заключение о рыночной стоимости интересующего нас объекта недвижимости.

 

Постановка задачи и предложенное решение

Очевидно, что достоверность оценки стоимости зависит от количества доступных для сравнения объектов, а также от полноты сведений о них: неоходимо знать расположение, год постройки, давность и качество ремонта, вид собственности, наличие обстановки, вид отопления, энергоэффективность, наличие парковки и др.

Сейчас база данных недвижимости ImmobilienScout24 содержит более 180 миллионов записей. Во многих из них необходимые сведения приведены в виде текстов, которые не подлежат автоматической обработке. Например: «двухэтажный кирпичный дом площадью 130 кв.м. Построен пять лет назад. Асфальтированный подъезд с 2-мя парковочными местами, мангалом, плодовыми деревьями, ягодными кустами, газоном с качелями и спортплощадкой. В доме установлен Интернет, спутниковая антена, пианино. На первом этаже комната-гостиная с камином, кухня-столовая с электрической плитой, ванная комната с душевой кабиной, 2 туалета, открытая летняя веранда. На 2 этаже 2 балкона и 3-и спальни.»

Алгоритм оценки стоимости ImmobilienScout24 требует использования строго классифицированных и структурированных данных. К сожалению, работать с записями, содержащими только текст, было практически невозможно. По этой причине оценка многих объектов была недоступна из-за отсутствия подходящих объектов для сравнения.

InterSystems совместно с партером — компанией n3 («n в кубе») — разработали инновационное решение VisualCockpit, которое извлекает нужные сведения из обычного текста и структурирует их.

VisualCockpit – высокопроизводительный инструмент бизнес-аналитики, основанный на высокопроизводительной базе данных InterSystems Caché® и интеграционной платформе InterSystems Ensemble®. Разработчики компании n3 использовали новые версии Caché с поддержкой технологии анализа текста iKnow.

 

Основные преимущества решения

  • Использование неструктурированных данных
  • Анализ произвольных текстов
  • Анализ больших объемов информации

 

Автоматический анализ данных с iKnow

В отличие от многих других технологий семантического анализа, iKnow автоматически распознает потенциально значимые конструкции и взаимосвязи внутри текстов без участия оператора или поисковых запросов. С помощью интеллектуального индексирования iKnow анализирует неструктурированный текст и преобразует его в систему концептов и связей.

iKnow определяет концепты, которые связаны друг с другом, являются ключевыми в предложении, тексте или в целом наборе документов. Затем результаты индексирования связываются со структурированной информацией из объявлений с помощью интеллектуального сопоставления. Наконец, в зависимости от конкретной задачи, к данным применяются те или иные методы обработки и формируются правила использования этого вида информации.

Например: «двухэтажный кирпичный дом площадью 130 кв.м. Построен пять лет назад». Из данного предложения iKnow определит, что речь в объявлении идет о том, что:

  1. количество этажей в доме – 2;
  2. общая площадь – 130 кв.м;
  3. материал стен – кирпич;
  4. год постройки – 2011.

Затем эти формализованные параметры будут использованы для поиска аналогичных объявлений и для оценки средней стоимости дома.

«Это делает наши услуги более привлекательными и позволяет нам предоставлять клиентам больше точных оценок их объектов недвижимости. Благодаря данному решению, в котором отсутствующие структурированные поля данных заполняются автоматически по текстовому описанию, у нас появилась возможность использовать значительно большее количество объектов для сравнения при проведении онлайн-оценивания».

Свен Фоершут (Sven Feuerschtte), вице-президент по услугам оценки
ImmobilienScout24

«iKnow подходит для решения самых разных задач: вы можете отыскивать интересующие вас сведения в наборе документов, автоматически обрабатывать информацию по схожим критериям, составлять сводку по длинным текстам и многое другое, — поясняет Матеус Нагел (Matthes Nagel), технический директор в компании n3. — Для оценки стоимости недвижимости в ImmobilienScout24 технология iKnow использует знания, соответствующие ключевым компетенциям оценщика, и выделяет структурированные данные (например, площадь помещения, этаж) из текстового описания объекта. iKnow позволяет формализовать для дальнейшего использования более 90% неструктурированных данных, преобразовав текст в числовые значения (метрики), которые доступны для обработки оценочным алгоритмом. Все это позволило улучшить ImmobilienScout24, увеличив заполняемость количественных и качественных данных об объекте, на которых строится оценка».

 

Результат внедрения

Благодаря инновационным методам обработки данных уже сегодня около 45 000 компаний и 73 000 частных лиц используют преимущества портала, размещая свои предложения недвижимости с подробным описанием объектов, фотографиями и планировками.

Ежемесячно на портале выставляется более 1,5 миллиона квартир и домов, а число просмотров превышает 300 миллионов.

Метки