България е сред лидерите по достъп до отворените фирмени данни в Европа, става ясно от Индекса за отворени фирмени данни (Open Company Data Index), който е базиран на информация от най-голямата отворена база в света OpenCorporates. Страната ни е на трето място по този показател, след Дания и Великобритания. Това става ясно след мащабна интеграция на данните от Търговския регистър на България, осъществена с помощ от българската компания за семантичен софтуер „Онтотекст“ АД, част от групата на „Сирма Груп Холдинг“ АД. В резултат, в момента страната ни се представя много добре по отношение на данните, достъпни за свободно търсене, свободен достъп и отворено лицензиране.
OpenCorporates въведе България като юрисдикция съвсем скоро, добавяйки около 970 000 нови дружества към своята отворена база с над 140 милиона компании от целия свят. В резултат сега международната база включва целия Български Търговски регистър, достъпен като отворени XML файлове, под публичния лиценз CC-0. Проектът е реализиран благодарение на експертизата на „Онтотекст“ в сферата на свързаните отворени данни (т.нар. Linked Open Data – LOD). Освен това българското дружество е подпомогнало екипа на OpenCorporates в по-доброто разбиране за Търговския регистър – една трудна задача както от техническа, така и от правна гледна точка. Сред основните предизвикателства в това отношение са били разбирането на схемата, както и интерпретирането на данните, включително ръчното прехвърляне на тези, които са на кирилица.
„Онтотекст“ участва и в редица други значими публични проекти в сферата на отворените и свързаните данни. Такъв е например европейският проект euBusinessGraph, в рамките на който се разработва платформа за интегриране, хармонизиране и публикуване на подробни данни за европейските компании. Припомняме, че преди около година българското дружество подкрепи и провелия се през 2017 г. в София Datathon, в който една от задачите пред отборите беше наречена „Да хакнем Търговския регистър на България“ и имаше за цел разработване на иновативни решения за повишаване ефективността на регистъра.