26 қыр, 2019 сағат 15:12

Big Data мен машиналық оқытудың маңызы

 

Машиналық оқыту мен үлкен деректер біздің қоғамға дендеп еніп, айтарлықтай әсерін тигізіп үлгерді. «Компьютерлерлік сана» енді онлайн режимде жұмыс істейтіндіктен, бізге қалғаны олардың тілін меңгеріп, өз пайдамызға жарату.

Үлкен деректер мен машиналық оқыту

Компьютердің деректерді сақтайтын қабілеті жетілген. Оларда шапшаң есептеу күші болғанымен, кей кезде қате жіберіп жатады.

Ал осы компьютерде үйреншікті сараптама әдісінің күйі келмейтін үлкен деректер болса ше? Мұны біз «үлкен деректер» деп атаймыз, себебі қазір әлемде мәліметтен көп нәрсе жоқ.

Соңғы данышпан

Ағылшын ғалымы, физик Томас Яң жарықтың толқындық теориясын жасаушылардың бірі болған. Эндрю Робинсонның «Білгір данышпан» атты кітабында Томас Яң әлемдегі ең соңғы данышпан ретінде суреттеледі.

Сіз өте ақылды әрі білгір болуыңыз мүмкін, бірақ әлемдегі барша мәліметті игеру мүмкін емес.

Адам баласының әлемді түсінуге деген ұмтылысы күн сайын қиындап барады. Үлкен деректер – әдеткі сараптама әдістерінің әлеуеті жетпейтін таудай мағлұмат деген сөз. Мағлұматтың көптігі сондай әрқайсысының мәніне жету мүмкін емес. Бұл мәселені шешу үшін әртүрлі автоматтандырылған техникаларды қолданысқа енгізу керек болады.

Мәселен, биржа нарығын алайық. Сіз биржадағы сан түрлі ұсыныстарды зерттеп, өзіңе қажеттісін табуың мүмкін. Алайда, әр секунд сайын өзгеріп тұратын мыңдаған сауда платформасындағы деректерді еске сақтай алмайсыз. Сол себептен де, мәселені шешу үшін компьютерленген жүйе қажет.

Машиналық оқыту

Машиналық оқыту жасанды интеллект, компьютерлік бағдарламалау, бизнес пен философияны біріктірген күрделі құрылым.

Яғни, машиналық оқыту сіз бір нәрсені көрген кезде миыңызда қорытып, шешім қабылдағаныңыз сияқты ірі мөлшердегі деректерді саралап, ең оңтайлы шешім шығарып береді.

Компьютерленген сананың көмегімен адамдар шешімі қиын сұрақтардың жауабын ала алады. Компьютер мүмкін болатын барлық жауаптарды тез арада шығарып береді. Егер миллиондаған нұсқаның тек біреуі ғана дұрыс болса, компьютер миллиондаған нәтижені модельдеп, ең дұрысын тауып береді.

 «Соғыс ойыны» атты фильмде Пентагон жасанды интеллектіге Кеңестік армияға қарсы ядролық шабуылдардың нәтижесін болжауды табыстайды. Компьютер болуы мүмкін шабуылдардың комбинациясын сараптамадан өткізгеннен кейін, «Термоядролық соғысты жеңудің жалғыз жолы – одан аулақ болу» деп жауап берген екен.

Бұл фильм қазіргі заман үшін өте идеалистік қалыпта саналады. 1980 жылдары жасанды интеллектің күрделі жауап беруге мүмкіндігі жоқ болатын. Бірақ 2018 жылдан кейінгі машиналық оқыту бизнес пен мәдениетке қатысты өте салмақты мәселелерді шеше алады.

Мысалы, сен пневмоұрғыш балға нарығындағы  ірі сатушысың делік.  Ал сен «Тағы бір балға зауытын салу керек пе?» деген сұрақтың жауабын білгің келеді. Бұл сұрақтың жауабын табудың бір жолы 50 миллион кредиттік карта чегін тексеріп, қанша адамның балға сатып алғынан сараптамадан өткізуге болады. Бірақ оны қалай іске асыруға болады? 50 миллион картадағы сатып алу жөніндегі жазбаларды сараптау үшін бүкіл өміріңіз жетпеуі мүмкін.

Ал машиналық оқыту мен ірі деректер сіздің балға зауытын салу немесе салмау мәселесін сараптап бере алады. Тым болмағанда олар сізді дұрыс жолға бағыттай алады. Әлемде осыған ұқсас алуан түрлі мәселе кездеседі және машиналық оқыту мен үлкен деректер оларды шешуге көмектеседі.

Деректерді қорғау туралы заң мен оларды шамадан тыс бақылаудың қаупі

2018 жылы Еуропалық Кеңес деректерді қорғау туралы заң қабылдады. Бұл өз кезегінде бағдарлама құрастырушыларға кедергі келтірді. Көптеген блоггердің айтуынша, деректерді қорғау туралы заң машиналық оқытуның кейбір түрлерін заңсыз деп тапқысы келеді. Болашақта машиналық оқыту мен заңнамалардың бірлесе жұмыс істеуін көріп қалуымыз әбден мүмкін.

Кез келген адам өзі жайлы жеке деректердің бөтен адамдардың қолына түскенін қаламайды. Бірақ саяси заңнама осы деректерге қатысты маңызды сұрақтарға немқұрайлылық танытып отыр. Деректерді қорғау туралы заңға сүйенсек, өзің жайлы деректерді тек өз мақсаттарыңа ғана қолдана аласың. 

Алайда, машиналық оқыту адамдарды жан-жақты зерттеп, олардың ойламаған қырларын ашуы мүмкін. Сол кезде «деректердің құпиялылығы» жайлы қате түсінік қалыптасады. Шындығында, машиналық оқыту біздің ақылымызға кіріп шықпайтын деректерді анықтауға қабілеті бар.

Бұл – билік басындағы адамдар машиналық оқытуның қауіпсіздігі туралы ойлануы керек деген сөз. Егер бір адам жарылғаш зат сатып алса, кейін осы деректі ғимарат жарғанын адамның кім екендігін анықтау үшін қолданбау – ақылға сиымсыз. Сондықтан, біздің қоғам үлкен деректермен компьютердік сананың қолданысын әлі де игере түсуі қажет.  

Мақаланың түпнұсқасы: medium.com