Българската компания за семантичен софтуер „Онтотекст“ АД, част от „Сирма Груп Холдинг“ АД, спечели финансиране в размер на 779 605 лв. по процедура BG16RFOP002-1.005 „Разработване на продуктови и производствени иновации“ по Оперативна програма „Иновации и конкурентоспособност“. Проектът се нарича „Интелигентно свързване на данни за компании от различни източници“ (Intelligent matching and linking of organization data from different sources – CIMA). Той започна през май 2018 г. и ще продължи до май 2020 година.
Екипът по проекта ще използва технологии като изкуствен интелект (AI – Artificial Intelligence), машинно обучение (machine learning) и семантично моделиране за свързване и интеграция на корпоративни данни от разнообразни източници. Това включва данни за личности, локации, браншови таксономии и различни технологични сфери, които ще бъдат интегрирани, свързани помежду си и в крайна сметка ще станат много по-лесни за използване.
В наши дни в световен мащаб има около 300 милиона юридически лица, а корпоративната информация е критична за все повече бизнес операции. Тя позволява управлението на взаимоотношенията с клиентите, привличането на нови клиенти, маркетинговите кампании, управлението на веригите за доставка, пазарните анализи, разузнаването на конкуренцията, сливанията и придобиванията, и много други области. Все още обаче липсват достатъчно добри и задълбочени инструменти за интегриране на данните в пазарните и бизнес анализи.
За създаването на такъв инструмент трябва да бъде обединена информацията от различни източници с разнообразна структура на данните и методи за достъпването им. В момента корпоративни данни могат да бъдат открити в официалните фирмени регистри на много държави, в отворени платформи като DBpedia, Wikidata, Panama Papers и др., в полу – търговски източници като OpenCorporates, в търговски източници или бази данни с инвестиционна информация. Често необходимата информация е откриваема само в новините или в други текстови източници като например данни за финансовите резултати или за фирменото ръководство.
В рамките на проекта CIMA „Онтотекст“ планира да използва дългогодишната си експертиза и опит в областта на когнитивните анализи на данни, на база на която е създадена Ontotext Platform. Тази платформа улеснява интеграцията на разнообразна структурирана информация и текстове в мащабни „Графове на знание“ (Knowledge Graphs), които включват информация за милиарди концепции и взаимоотношенията между тях.
Целта на проекта е да хармонизира данните чрез семантично представяне и интеграция, както и да разработи методи за семантично съчетаване, свързване и извличане в конкретна област. Екипът на „Онтотекст“ вече е създал решения в тази област за някои от най-големите компании за бизнес информация, консултанти по сливания и придобивания и в рамките на проекта ще разшири своето портфолио в тази област. В крайна сметка целта на CIMA проекта е да инвестира в изследователска и развойна дейност, която в последствие да направи доставката на такива решения много по-ефективна. Ще бъдат добавени и нови функционалности към водещите продукти на „Онтотекст“ - Ontotext Platform и Ontotext Cognitive Cloud.