Dragomirs Radevs izskaidro Siri zinātni

Sveiki, Siri, atrodiet man ķīniešu restorānu.. ak, nevis itāļu. Un veiciet rezervāciju diviem šo svētdien pulksten 20. Nekādas gaidīšanas. Sestdienas vakars.

Tas var radīt apjukumu katrā lasītājā, bet dators to saprot. Un tas darbojas uz tā. Kāda veida tehnoloģija to padara iespējamu? To skaidro profesors Dragomirs Radevs, Jēlas universitātes datorzinātņu profesors un Jēlas universitātes Dabiskās valodas apstrādes (NLP) laboratorijas direktors.

Visums Radevs ir vienīgais bulgāru profesors prestižajā Jēlas universitātē, viņš ir arī Ziemeļamerikas atklātā konkursa skaitļošanas valodniecībā līdzdibinātājs un trenējis ASV izlasi Starptautiskajā valodniecības olimpiādē par vairākām zelta medaļām. Pagājušajā mēnesī viņš atgriezās Sofijā, Bulgārijā INSAIT sazvērestība Jaunās tendences mākslīgā intelekta un skaitļošanas pētniecībā, kur viņš sniedza galveno runu par mākslīgo intelektu, veidojošiem modeļiem un dabiskās valodas apstrādi.

Dragomirs Radevs absolvēja vidusskolu Sofijā 1986. gadā. Viņa aizraušanās ar valodniecību aizdegās tajā laikā, kad viņš pirmo reizi mēģināja startēt valsts mēroga konkursos, bet īstā iedziļināšanās datorlingvistikā un NLP pētniecībā sākās, kad viņš aizbrauca mācīties uz ASV. 1991. gadā viņš gadiem ilgi strādāja pie teksta apkopošanas, semantiskās analīzes, dabiskās valodas saskarnēm datu bāzēm, sentimenta analīzes un atbildēm uz jautājumiem. Viņa ilgtermiņa vīzija ir izveidot infrastruktūru, lai datori un cilvēki mijiedarbotos plūstoši un dabiski, kā arī izmantot NLP, lai izstrādātu izglītības un medicīnas lietojumprogrammas.

Vārdi pret cipariem? Zinātne aiz NLP

Radevs sāk, skaidrojot jēdzienu no pamatiem: “Dators ir uzbūvēts tā, ka tas spēj domāt tikai skaitļos.” “Viņu atmiņu veido biti un baiti, un katrs bits atbilst 0 vai 1. Dosimies soli tālāk. Padomājiet par vienkāršu attēlu, ko redzat savā datorā. Šis attēls attēlo īpašu matricu, kas apvieno miljoniem pikseļu. Katrs pikselis atbilst noteiktai krāsai un līdz ar to noteiktiem baitiem”.

READ  Vai es joprojām varu izplatīt COVID-19, ja esmu vakcinēts?

Tas pats attiecas uz vārdiem, viņš skaidro. Datori nav paredzēti, lai pieņemtu un apstrādātu informāciju teksta vai semantiskā formātā. Tādējādi viņai viss ir jāpārtulko skaitļos vai, kā tos sauc datorzinātnieki, – tenzoros. Tenzors ir lineārās algebras jēdziens, kas atbilst vektora jēdzienam.

“Kad es kaut ko saku vai ierakstu ķīniešu vai angļu valodā, datoram tas automātiski jāpārtulko skaitļos. Katrs vārds tiek attēlots kā noteikts tensors, un dators pēc tam var apmācīt sevi un izdarīt vēsturiskas analoģijas, lai balstītos uz savām semantiskajām zināšanām. ,” skaidro Radev. , piebilstot, ka, izmantojot sintētisko semantiku, dators veido lielākus vārdu vektorus, kas veido vārdu savienojumus. “Tādējādi tā zina, ka darbības vārds aiz vārda “suns” būs “riešana”, nevis “murrāt”. Visas šīs sarežģītās aritmētiskās un skaitļošanas darbības ir daļa no standarta metodes jebkura veida mākslīgā intelekta apmācībai un apstiprināšanai, tostarp NLP.” .

Cik bieži mēs mijiedarbojamies ar NLP?

katru dienu. Dragomirs Radevs skaidro tendences, kuru dēļ šī tehnoloģija ir plaši izplatīta.

“Dabiskās valodas apstrādei mūsdienās tiek pievērsta liela uzmanība vairāku iemeslu dēļ. Pirmkārt, ir milzīgs datu kopums, ko var izmantot datorsistēmu apmācīšanai. Tādiem uzņēmumiem kā Google un Microsoft ir pieejams gandrīz viss internets, kas nozīmē daudz teksta Otrkārt, datori kļūst spēcīgi Ļoti, un, treškārt, globalizācija ir radījusi nepieciešamību pēc starpkultūru sarunām.Krievu, ķīniešu un spāņu valodas ir kopīgas valodas, bet jādomā, ka jāsazinās ar kādu no Latvijas vai Bulgārijas. ”

Visas mūsu izmantotās meklētājprogrammas galvenokārt ir balstītas uz NLP. Katru reizi, kad atveram Google Maps, izmantojam personīgo asistentu lietotnes vai Voice and Message Leader, mēs mijiedarbojamies ar NLP. Taču tas, kas pēdējo desmit gadu laikā ir mainījies, ir tehnoloģiju briedums un inteliģence. Mēs visi atceramies, ka mēs ņirgājamies par Google automātiskajiem tulkojumiem, taču mūsdienās mūsdienu meklētājprogrammas ne tikai izprot gramatiku, bet arī izprot mūsu meklēšanas mērķa semantiku.

READ  Jauni attēli atklāj, kā patiesībā izskatās Neptūns un Urāns

Neatklātas iespējas NLP

Līdz ar Radev sabrukumu NLP sāka atrast izmantošanas gadījumus finanšu sektorā. Daudzas bankas un ieguldījumu fondi iegūst atbilstošu finanšu informāciju no ziņu avotiem un izmanto to, lai to pārvērstu skaitļos, ievadītu datus matemātiskajos vienādojumos, izgūtu prognozes un konsultētu par investīciju lēmumiem.

Vēl viena nozare ir veselības aprūpe. Turklāt ir slejas, kurās NLP jau tiek plaši izmantots, taču joprojām ir daudz iespēju uzlabot. “Piemēram, e-komercijā dialogu sistēma var paveikt daudz labāk. Dialoga tehnoloģija nozīmē, ka datori var atbildēt uz jautājumiem, pamatojoties uz iepriekšējiem sakariem, bez katra konkrētā jautājuma pilnīga konteksta. Pašlaik Microsoft, SalesForce un Facebook par šiem dialogiem metodes,” dalās Radevs.

Kā tiek tirgoti universitātes pētījumi?

Universitātes laboratorijas raksta publikācijas un veido prototipus, taču neiedziļinieties šo risinājumu integrēšanā biznesā. Tomēr visi universitātes laboratorijās veiktie pētījumi, kodi un rezultāti tiek ievietoti GitHub repozitorijā un pieejami publiskai lietošanai. Personas un uzņēmumi pēc tam var izmantot kodu, lai integrētu to savos produktos vai modificētu un uzlabotu to tādā veidā, kas atbilst viņu tehnoloģiju vajadzībām. Mūsdienās arvien vairāk uzņēmumu, piemēram, Google un Facebook, sāk atvērt savas iekšējās laboratorijas.

Bulgārijas dziļais tehniskais potenciāls un INSAIT loma

Kad Mārtiņš Fiščevs, inženieris INSAITApmēram pirms diviem gadiem viņa vērsās pie manis ar domu, ka Bulgārija varētu kļūt par vietu, kas pulcē globālos datorus un mākslīgā intelekta zinātniekus, un tas uzreiz sasaucās ar viņa redzējumu. Zīmīgi, ka INSAIT kā pētniecības centra galvenais mērķis nav lietojumprogrammu, bet gan publikāciju izgatavošana.

Katra pētniecības centra kvalitāte ir atkarīga no tajā strādājošajiem cilvēkiem, un tā stāvoklis tiek vērtēts pēc publikāciju un pētījumu citātu skaita. Diemžēl tagad datorzinātņu pētniecības jomā Bulgārijas pētniecības laboratorijas nepastāv. Tomēr ir daudz bulgāru pētnieku, kuri strādā ārzemēs un ir atzīti visā pasaulē.

READ  AI pieeja var palīdzēt atklāt Alcheimera slimību, veicot ikdienas smadzeņu attēlveidošanas testus

Bulgārija atrodas Dienvidaustrumeiropas reģiona centrā, un tai ir liels potenciāls piesaistīt izcilākos zinātniekus no Grieķijas, Rumānijas un pat Polijas un Čehijas. Mums ir apbrīnojams talants, kuram ir jāpamet un jāstrādā Apvienotajā Karalistē vai Šveicē, jo viņiem šeit nav tādu iespēju. Izmantojot INSAIT, nākamie dziļo tehnoloģiju un datorzinātņu pētnieki varēs darīt tieši to Attīstieties kā pasaules līmeņa pētnieki SofijāDragomirs Radevs secina.

Angelica Johnson

"Tīmekļa praktizētājs. Sašutinoši pazemīgs ēdiena entuziasts. Lepns twitter advokāts. Pētnieks."

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *

Back to top