Проектът № BG05M2OP001-1.002-0002 – „Дигитализация на икономиката в среда на Големи данни“ (ДИГД) е на стойност над 13,3 млн. лв., от които над 11 млн. лв. европейско и 2 млн. лв. национално съфинансиране. Срокът за изпълнение е от март 2018 г. до декември 2023 г.
Водеща организация е Университетът за национално и световно стопанство (УНСС), а партньори по проекта са Технически университет – Габрово, Икономически университет – Варна, Русенски университет „Ангел Кънчев“, Пловдивски университет „Паисий Хилендарски“, Институт по Информационни и комуникационни технологии – БАН. Сред асоциираните партньори е Universidade Nova de Lisboa /Faculdade de Ciencieas e Tecnologia/ („УНИНОВА” Лисабон, Факултет по наука и технологии).
Дигитализираните бизнес процеси работят със структурирани данни, намиращи се в Релационни бази от данни. Обработката на такива данни се управлява от Системи за управление на релационни бази от данни (СУРБД). Прехвърлянето или използването на една част от големите данни – структурираните данни, не е проблем за управление от СУРБД. Една друга, но голяма част от големите данни – полу-структурираните данни, се предвижда да се трансформират в структурирани чрез използване на две технологии – Text mining и Web mining, след което да се заредят за обработка в СУРБД. За целта СУРБД трябва да могат да обработват почти в реално време (в рамките на секунди) тези огромни обеми от данни (таблици с размери 100–1000 милиарди редове). В Центъра по компетентност се предвижда използване на нов тип СУРБД – такива с работа в паметта на 2 формата на релационни данни – Формат в редове и Формат в колони, наречени работно „СУРБД работещи в паметта“ (Фиг.1).
При класическите (преобладаващите в света) СУРБД се работи само с Формат в редове. За да се осигури ускорена работа на цифрови бизнес процеси с данни от „големите данни“ се предвижда опериране със същите данни, но във Формат на колони (в компресиран вид), премахващ необходимостта от индекси и осигуряващ голямото бързодействие на достъп до огромните данни. За целта се разширява хардуерно оперативната памет в тази видове сървъри. В предлагания проект ще се работи със СУРБД, работеща в паметта. Характерно за СУРБД, работеща в паметта, е възможността за опериране на данни, разположени в Hadoop система, посредством специално създадени конектори към Hadoop.
Центърът за компетентност по „Дигитализация на икономиката в среда на Големи данни“ (ЦК-ДИГД) ще бъде ИКТ комплексна инфраструктура (Фиг.2).
Основата на предлаганата инфраструктура на ЦК-ДИГД се състои от интегрирано преливане между цифровизирани бизнес процеси и обработка на големи данни – процес изграден върху ИКТ ресурси на самия Център, който ще предлага 4 вида научноизследователски услуги. Преливането на функциониране между обработката на големи данни при дигитализиране на бизнес процесите се базира на вграждане и предлагане за изследване и анализ на най-добрите световни практики. Това означава, че на изследователите, които ще използват ЦК-ДИГД, ще се предоставят световните най-добри резултати в дигитализиране на определените бизнес области. Изследователите ще могат също така да извършват сравнение чрез прилагане на метода на бенчмаркинг, къде се намира тяхната желана за дигитализиране бизнес област (фирма или част от бизнес дейност на фирма) в рамките на достиженията на света. Характерно на този бенчмаркинг е, че световните достижения и най-добрите практики ще се актуализират регулярно, за да може изгражданият Център за компетентност да предоставя на изследователите си винаги най-съвременните световни достижения като стартова основа за започване и провеждане на изследвания.
Създаваният ЦК-ДИГД ще предлага на своите клиенти като краен продукт 52 услуги за провеждане на научни изследвания и за обучение, обобщени в 2 категории – Научноизследователски услуги и Системни научно-приложни услуги.
Научноизследователски услуги – 30 услуги, групирани в 4 вида:
- Услуги, създаващи стратегии за дигитализация;
- Услуги за дигитализация на процеси;
- Услуги за избор на ИКТ продукти, чрез които да се реализират и прилагат решения на дигитализация на икономически активности в отделни фирми и организации;
- Научни услуги за ползване на ресурсите на Център за компетентност от други научни организации за научни изследвания.
Системни научно-приложни услуги – 22 услуги, групирани в 4 вида:
- Проектиране на хардуерни системи, свързани с обработка на големи данни;
- Проектиране на методи, модели и алгоритми за обработка на големи данни;
- Интегриране на големи данни към дигитализирани бизнес процеси;
- Проектиране на компютърни компоненти за обработка на големи данни.
Посочените по-горе 30 Научноизследователски услуги и 22 Системни научно-приложни услуги, както и техните специфични детайлни услуги, са външните услуги, които ЦК-ДИГД ще предлага на желаещите да извършват научни изследвания в областта на дигитализиране на икономиката в среда на големи данни. След изтичане срока на проекта, тези услуги и техните бъдещи прецизни доразвития ще представляват търговския продукт, който Центърът ще предлага на пазара.
Научна инфраструктура на ЦК-ДИГД ще предоставя възможности за изследване и предлагане на 3 вида корпоративни компютърни решения за дигитализация: решения за развитие, решения за диференциране – проектиране на нови ИКТ компоненти и системи за дигитализация, включващи обработка и на неструктурирани данни и решения за иновативност.
ЦК-ДИГД и предвижданите научноизследователски дейности ще доведат до развиването на нови технологии на високо международно ниво в областта на информационните и комуникационни технологии. В създавания ЦК-ДИГД ще се развиват технологии за дигитализация на бизнес процеси, които по принцип са световни технологии на високо научно ниво, ще се създават и нови технологии за работа с големи данни, които ще са на високо международно ниво.
Тук можете да прочетете интервюто с проф. Кисимов от ръководния екип на проекта.