Деректер көлемінің өсуін үнемі жеделдету қазіргі шындықтың ажырамас элементі болып табылады. Әлеуметтік желілер, мобильді құрылғылар, өлшеу құрылғыларынан алынған мәліметтер, іскери ақпарат-бұл деректердің алып массивтерін құруға қабілетті көздердің бірнеше түрі. Қазіргі уақытта Big Data (үлкен деректер) термині кең таралды. Деректердің үлкен массивтерін өңдеу технологиялары қоғам өмірінің әртүрлі аспектілерін қаншалықты тез және терең өзгертетінін әлі де түсінбейді. Өзгерістер әртүрлі салаларда орын алып, жаңа проблемалар мен сын-тегеуріндерді тудырады, соның ішінде ақпараттық қауіпсіздік саласында, мұнда құпиялылық, тұтастық, қолжетімділік және т. б. сияқты маңызды аспектілер алдыңғы қатарда болуы керек.
Еңбек нарығында күрделі құрылымның көпөлшемді деректерін талдау саласында жұмыс істей алатын мамандар сұранысқа ие. Ұйымдар деректердің үлкен массивтерін жинады, олардың көпшілігі нашар құрылымдалған. Оларды өңдеу және талдау бизнес-процестер жеделдетілгендіктен, бәсекелестік күшейіп, уақтылы және дұрыс қабылданған шешімнің бағасы өскен сайын өзекті бола түсуде. Соңғы жылдары Интернет желісінде, әсіресе "әлеуметтік желілер"түрінде орналастырылған жеке және жеке деректер талдау үшін қол жетімді бола бастады.
Аналитиктерді даярлаудың классикалық схемасы бұл қиындықтарға сәйкес келмейді, өйткені ол деректерді өңдеу мен талдаудың қосымша міндеттерін, соның ішінде құрылымданбаған үлкен көлемді деректерді жүйелі түрде қамтымайды. Сонымен қатар, әр түрлі типтегі және типтегі деректерді өңдеу әдістемесімен, мәліметтер қоймаларына қол жетімділікті реттеумен, сақтау құрылымын қайта құрумен, өңдеу процестерінің тиімділігімен, үлкен деректерді талдаумен байланысты мәселелерді шешуге жүйелі түрде жақындауға дайын мамандардың тапшылығы айқын. статистикалық эксперименттерді жүргізу схемалары, жуықталған әдістер, тиімді Алгоритмдер) және т. б. тапшылық байланысты технологиялардың дамуымен шиеленіседі: 3D басып шығару, толықтырылған шындық, бұлтты есептеу, "ақылды" орта және т. б.
Мысал ретінде жетекшіlline-алаңдардағы бос жұмыс орындарында көрсетілген құзыреттерді келтіруге болады: үлкен көлемдегі деректермен жұмыс, деректерді талдау, BI, Big Data, Distributed Cache, data-Warehouse, ETL, Business Intelligence, Hadoop, MapReduce, әлеуметтік желілерді талдау тәжірибесі, Big Data-мен жұмыс тәжірибесі және т. б.
"Big Data Analytics" білім беру бағдарламасы ақпараттық жүйелерден құрылымдық және құрылымданбаған түрлердегі деректермен жұмыс істеуді, үлкен деректерді өңдеуді, Big Data технологияларын, Excel, SQL және ішкі талдау жүйелерімен жұмыс істеуді қамтиды. Әр түрлі жүйелерден деректерді байланыстыра отырып, ішкі деректер қоймаларын жобалау, сондай-ақ бақылау тақталары мен аналитикалық есептерді құру. BI жүйесін (Oracle, IBM, Sas және басқалары), SQL, ETL құралдары мен бағдарламалау тілдерін пайдалану. Құрылымдық және құрылымданбаған деректерді өндіру. Негізгі бизнес мәселелерін шешу үшін статистиканы, машиналық оқытуды және болжамды аналитиканың озық әдістерін қолдану.
Білім беру бағдарламасы деректерден білім алудың заманауи әдістерін, модельдеу мен болжаудың математикалық әдістерін, деректерді талдауға арналған заманауи бағдарламалық жүйелер мен бағдарламалау әдістерін дайындауды қарастырады.
БББ мақсаты-математика, статистика, акт, информатика, бизнес және экономика салаларында білімі бар әмбебап маман дайындау.
БББ міндеттері:
- Математика, статистика, акт, информатика, бизнес және экономика салаларында білімі бар әмбебап маман дайындау.
- Студенттерге нарықтық тенденциялар, клиенттердің қалауы және т. б. сияқты әртүрлі ақпаратты қамтитын деректердің үлкен массивтерін зерттеу әдістерін үйрету.
- Нақты уақыт режимінде Ақпарат ағындарын қоса алғанда, барлық көздерден қажетті ақпаратты алу, оны одан әрі бизнес шешімдерін қабылдау үшін талдау және жиналған ақпарат жүйесіндегі логикалық байланыстарды көру және соның негізінде белгілі бір бизнес шешімдерін, модельдерін әзірлеу қабілетін дамыту.
- Студент деректер ғылымы саласындағы зерттеу әдістемесін (зерттеу мақсаттарын қою, деректерді жинау, деректерді өңдеу және түрлендіру, деректерді зерттеу, модельдерді құру және әдістерді таңдау, нәтижелерді ұсыну және визуализациялау), деректерді стандарттау мен түрлендірудің әдістері мен тәсілдерін, Машиналық оқыту әдістерін (жіктеу мен кластерлеудің негізгі әдістері), ұйымдастыру тәсілдерін білуі керек деректерді сақтау.
- Студент жасырын тәуелділіктерді анықтау үшін деректерді өңдеу және талдау бойынша қолданбалы есептерді шеше білуі, деректер ғылымының модельдері мен әдістерінің негізінде жатқан Ықтималдықтар теориясы мен математикалық статистика элементтерін қолдана білуі, практикалық есептерді шешу үшін машиналық оқыту әдістерін дұрыс таңдай білуі, зерттеушінің жұмыс ортасын ұйымдастыра білуі керек. деректер ғылымы (Jupyter),Машиналық оқыту үшін пакеттер мен кітапханаларды пайдаланыңыз (Matplotlib, SciPy/NumPy, Pandas, Scikit-learn).
- Студент деректерді сақтауды ұйымдастыру құралдарымен жұмыс істеу дағдыларын, деректерді өңдеу және талдау құралдарының R және Python тілдерінде бағдарламалық қамтамасыз етуді іске асыру дағдыларын, деректерді өңдеу және визуализациялау дағдыларын меңгеруі керек;
Студент ғылым мен техниканың заманауи жетістіктерін пайдалана отырып, ғылыми-зерттеу жұмыстарының нәтижелерін кешенді талдау және талдамалық жалпылау дағдыларын, зерттеу тақырыбы бойынша ғылыми-техникалық ақпаратты өз бетінше жинау, зерттеу, талдау және жалпылау дағдыларын, зерттелетін объектілердің қасиеттерін болжауға мүмкіндік беретін теориялық модельдер құра білуді және нәтижелерді енгізу бойынша ұсыныстар әзірлеуді меңгеруі тиіс.