«Balsu talkā» mācīs tehnoloģijām runāt latviski

 

Vai esat mēģinājuši “Youtube” latviskiem videoklipiem uzlikt latviešu subtitrus? Vai arī dot balss komandas latviski tālrunim, “gudrajai mājai”, robotam putekļsūcējam, virtuālajiem asistentiem vai vēl kādai viedajai tehnoloģijai? Bieži vien tas gluži vienkārši nestrādā vai arī rezultāts ir kļūdains. Tas tādēļ, ka viedās tehnoloģijas latviešu valodu lielākoties neatpazīst. Taču tagad ikvienam no mums ir iespēja piedalīties projektā, lai palīdzētu viedajām tehnoloģijām iemācīties sazināties arī latviski.

Tehnoloģiju izstrādātājiem, kuri vēlētas savos produktos iespējot arī latviešu valodas saziņu, šobrīd trūkst izejmateriāla – proti, latviskās runas ierakstu. Tādēļ projektā “Balsu talka” cilvēki tiek aicināti kopīgi radīt šādu datu kopu.

Kā šī balsu talka notiek? Vispirms jāieiet mājaslapā “balsutalka.lv”. Tā pieejama gan datorā gan telefonā. Sameklē sadaļas “Runā” vai “Klausies”. Runāšanas sadaļā dators dod dažas frāzes, kas jāierunā. Spiež uz mikrofonu un ierunā. Spiež uz “Es piekrītu”, un esam ziedojuši savus balss ierakstus un veiksmīgi notalkojuši. Talkā var piedalīties, arī klausoties citu balsu ierakstus un novērtējot, vai tie patiešām atbilst ierunātajam tekstam.

“Ir vajadzīgi pēc iespējas vairāk akcentu, pēc iespējas vairāk dažādu izrunu. Jo dažādākas balsis būs, jo labāka atpazīšana pēc tam notiks,” stāstīja Latvijas Atvērto tehnoloģiju asociācijas vadītājs Pēteris Jurčenko.

Kopīgi izveidotā datu kopa nebūs maksas produkts. Tā būs brīvi pieejama ikvienam ražotājam, kurš vēlas radīt kādu viedo tehnoloģiju, kas sapratīs arī komandas latviešu valodā, un pelnīt – tirgojot tās arī Latvijas pircējiem.

“Šie balss paraugi būs zem atvērtās licences, viņi būs pieejami ikvienam. Lielie tehnoloģiju ražotāji varēs tos iekļaut savos produktos. Ja, piemēram, kāds mašīnas ražotājs izdomās uztaisīt valodu atbalstu komandām, tad līdzās poļu, igauņu valodām varēs iekļaut arī latviešu valodu un mašīnas to atpazīs,” skaidroja Jurčenko.

Pirmajās dienās ierunātas jau vairāk nekā 20 stundas.

Avots: LSM.lv. Pilnu rakstu lasīt šeit

Exploring the Role of Artificial Intelligence in Language Training

The use of artificial intelligence (AI) in language training has become increasingly popular in recent years. AI-powered language learning platforms and tools are being used by individuals and institutions alike to improve language proficiency and provide personalized language instruction.

One of the key benefits of using AI in language training is the ability to provide customized and personalized instruction. AI systems can analyse an individual’s language abilities and develop a tailored language learning plan that takes into account their strengths, weaknesses, and goals. This personalized approach allows for more efficient and effective language learning, as the learner is able to focus on the areas where they need the most help.

Another advantage of AI-powered language training is the ability to provide real-time feedback and corrections. Many language learning platforms and tools incorporate AI technology that can provide learners with instant feedback on their pronunciation, grammar, and vocabulary usage. This can help learners to quickly identify and correct their mistakes, improving their language skills over time.

Additionally, AI can be used to create engaging and interactive language learning experiences. For example, some language learning platforms use AI to generate personalized language lessons and activities, such as conversations with virtual language tutors or games and quizzes that reinforce language skills. These interactive experiences can help to keep learners engaged and motivated, improving the overall effectiveness of language training.

However, it’s important to note that AI is not a replacement for human language teachers. While AI can provide valuable assistance in language training, it is not capable of replicating the nuanced understanding and guidance that a human language teacher can provide. As such, the best approach to language training is to use AI as a supplement to human instruction, rather than a replacement.

In conclusion, AI has the potential to greatly enhance language training by providing personalized instruction, real-time feedback, and engaging learning experiences. While it is not a replacement for human language teachers, AI can be an effective tool for improving language skills and proficiency.

Eiropā izveidota platforma, kas palīdzēs nojaukt valodu barjeru

Eiropā izveidota platforma, kas palīdzēs nojaukt valodu barjeru

Eiropas Savienības finansētā projektā “SELMA” izveidotā platforma palīdzēs nojaukt valodu barjeras, “Latvijas Avīzei” apliecināja Latvijas Universitātes Mākslīgā intelekta laboratorijas vadošais pētnieks Guntis Bārzdiņš.

Latvijas Universitātes Matemātikas un informātikas institūts (LU MII) sācis līdzdalību Eiropas Savienības pētniecības un inovāciju programmas “Horizon 2020” projekta “SELMA” īstenošanā.

Projekta laikā ar dažādu valstu institūciju palīdzību tiks izveidota daudzvalodu atvērtā pirmkoda platforma, kurā, izmantojot dziļo mašīnmācīšanos, izstrādās jaunas metodes mākslīgā intelekta valodas modeļu iegūšanai. Vienkāršoti runājot, īpašā platformā žurnālisti un mediju analītiķi varēs pētīt tekstuālo un audiovizuālo saturu.

Kā “Latvijas Avīzei” skaidroja LU MII Māk­slīgā intelekta laboratorijas vadošais pētnieks Guntis Bārzdiņš, “SELMA” projektā izveidotā platforma palīdzēs nojaukt valodu barjeras.

“Vēsturiski kvalitatīvas runas transkriptēšanas un tulkošanas tehnoloģijas bija pieejamas tikai lielajām kompānijām, taču jaunākās daudzvalodu dziļās mašīnmācīšanās metodes nepieciešamos valodas modeļus padara pieejamus ikvienam. Projekts lielākoties ir vērsts uz šo visjaunāko tehnoloģiju pielāgošanu mediju vajadzībām, lai atvieglotu to ieviešanu ikdienas darba procesos.”

Līdztekus liela apjoma ziņu tulkošanai un automātiskai grupēšanai pa tēmām, viens no interesantākajiem projekta virzieniem būs automātiska videosižetu tulkošana, kas būtībā ļaus tulkot pat veselas filmas.

Videosižeta tulkošana ietvers vairākus soļus – oriģinālo audio transkriptēšanu, teksta tulkošanu, dažādu balsu runas sintēzi no teksta. Turklāt šie soļi būs jāveic sinhroni, lai tulkotā runa sakristu ar runātāja lūpu kustībām.

Izklausās kā kaut kas līdzīgs jau valodu tehnoloģiju uzņēmuma “Tilde” veidotajām sistēmām, tostarp iespējai ierunātu audiofailu transkriptēt žurnālista vietā.

Diemžēl žurnālistiem sistēma vēl nav īsti izmantojama. Bārzdiņš skaidro, ka runas transkriptēšanas sistēmu kļūdām ir divi avoti – neskaidri izrunāts teksts un jauni, sistēmai nezināmi vārdi – pārsvarā personu uzvārdi un reti lietoti termini.

“Atšķirībā no “Tildes” “SELMA” tehnoloģijas pamatā ir iespēja lietotājam interaktīvi izlabot sistēmas pieļautās kļūdas, un šie labojumi automātiski papildinās “SELMA” vārdu krājumu ar jaunu terminu un uzvārdu pareizrakstību, tādējādi uzlabojot gan tālāko transkripciju, gan tulkošanu, gan runas sintēzi.”

Platforma spēs apstrādāt desmit miljonus satura vienību dienā. Satura vienība varēs būt gan videosižets, gan preses paziņojums dažādos kanālos, gan citas ziņas. Izstrādātāji skaidro, ka platformas mākslīgā intelekta komponenti tiks regulāri pilnveidoti un sistēma spēs pašmācīties.

Svarīgi, ka platforma vispirms apkopos un analizēs saturu oriģinālvalodā, nevis izmantos angļu valodu kā starpniekvalodu. Savukārt tulkošana un runas sintēze citās valodās tiks veikta pēc pieprasījuma.

Projektu gandrīz 3,5 miljonu apmērā pilnībā finansē Eiropas Savienība, taču ikviens no partneriem, tostarp LU, jau iepriekš daudzus gadus strādājuši šīs jomas attīstīšanai.

Bārzdiņš pārliecināts, ka visu “SELMA” partneru kopējās investīcijas šīs jomas attīstīšanai ir mērāmas desmitos miljonu eiro.

Avots: LA.lv. Visu rakstu lasiet šeit.

Ierunājot Latvijas himnu, aicina palīdzēt mākslīgajam intelektam atpazīt latviešu valodu

Ikviens, kura dzimtā valoda nav latviešu, ir aicināts iesaistīties mākslīgā intelekta apmācībā, ierunājot Latvijas valsts himnu tīmekļa vietnē “Ierunā himnu”. Valodu tehnoloģiju uzņēmums “Tilde” iesūtītos audioierakstus izmantos, lai veidotu iekļaujošu mākslīgā intelekta risinājumu latviešu valodas runas atpazīšanai.

“Tildes” mākslīgā intelekta biznesa attīstītājs Mārtiņš Sūna skaidroja, ka mākslīgā intelekta apmācība ir sarežģīts un laikietilpīgs process, kas nav iespējams bez kvalitatīviem un daudzveidīgiem datiem.

“Lai runas atpazinējs latviešu valodā spētu pilnvērtīgi atpazīt vienu no mūsu valsts simboliem – nacionālo himnu, tam ir nepieciešams tūkstošiem dažādu audio paraugu. Cilvēki himnas vārdus izrunā tik dažādi – atšķiras izloksnes, dikcija, balss tembrs, akcenti, kā arī akustiskā kvalitāte, un visi šie mainīgie faktori mākslīgajam intelektam jāņem vērā mašīnmācīšanās procesā,” pauda Sūna.

Projekts “Ierunā himnu” ir daļa no Pilsonības un migrācijas lietu pārvaldes (PMLP) īstenotā Patvēruma, migrācijas un integrācijas fonda projekta, kurā tiks izstrādāts Latvijas pilsonības iegūšanas valodas prasmju un zināšanu pašpārbaudes elektroniskais rīks. Tas ļaus pilsonības pretendentiem pārbaudīt latviešu valodas prasmes, Satversmes pamatnoteikumu, valsts himnas teksta, kā arī Latvijas vēstures un kultūras pamatu zināšanas.

Plānotais rīks atbalstīs Latvijas pilsonības pretendentus, kuri gatavojas naturalizācijas eksāmenam, ļaujot viņiem ar mākslīgā intelekta programmas palīdzību novērtēt savas Latvijas valsts himnas zināšanas.

Avots: latviesi.com. Visu rakstu lasiet šeit.

Mākslīgā intelekta valodu tehnoloģijas – attīstības tendences un jaunas iespējas

Mākslīgā intelekta valodu tehnoloģijas – attīstības tendences un jaunas iespējas

Covid-19 pandēmija izraisījusi straujas pārmaiņas patērētāju tendencēs un veicinājusi uzņēmumu un institūciju interesi par valodu tehnoloģiju risinājumiem straujāk nekā varējām prognozēt. Vēlos dalīties pārdomās, kas mūs sagaida 2021.gadā un par kādiem mākslīgā intelekta risinājumiem uzņēmumiem vajadzētu domāt.

Mašīntulkošana – durvis uz daudzvalodīgo pasauli

Esam pārliecināti, ka arī biznesa organizācijas Latvijā pārvarēs iespējamās bažas un aktīvi ieviesīs mākslīgā intelekta tehnoloģiju risinājumus klientu atbalsta un pārdošanas procesu efektivitātes celšanai. Tieši valodu tehnoloģijas paver lielajiem un mazajiem uzņēmumiem durvis uz pasauli, kas runā vairāk nekā septiņos tūkstošos valodu.

Uzņēmumi arvien vēlas iekarot jaunus tirgus un, neskatoties uz to, ka angļu valoda ir globālā biznesa valoda, tie saskaras ar valodas barjeru, jo cilvēki vēlas saņemt informāciju un komunicēt ar kompānijām un publiskajām institūcijām savā dzimtajā valodā. Pētījumi liecina, ka 75% cilvēku dod priekšroku pirkumam dzimtajā valodā, 42% no viņiem visdrīzāk nepirks produktu vai pakalpojumu, ja informācija par to nebūs pieejama viņu dzimtajā valodā. Tas ir viens no galvenajiem iemesliem, kapēc visā pasaulē strauji aug pieprasījums pēc kvalitatīviem mašīntulkošanas pakalpojumiem. Tiek prognozēts, ka mašīntulkošanas pakalpojumu tirgus līdz 2024. gadam palielināsies par 19% un sasniegs 1,5 miljardus ASV dolāru. Šādu izaugsmi veicina digitālās informācijas strauji pieaugošais apjoms, nepieciešamība pēc daudzvalodīgas saziņas un zināšanu pārvaldības gan starptautisko uzņēmumu iekšienē, gan arī komunikācijā ar klientiem un sadarbības partneriem.

Arī Latvijā turpinās augt pieprasījums pēc satura ātras un rentablas tulkošanas, ko nodrošinās uzņēmumu un iestāžu klientu un darbinieku atbalsta portālos, mājaslapās un saziņas rīkos integrēti mašīntulkošanas rīki.

Avots: Ir.lv. Visu rakstu lasiet šeit.