«Balsu talkā» mācīs tehnoloģijām runāt latviski

 

Vai esat mēģinājuši “Youtube” latviskiem videoklipiem uzlikt latviešu subtitrus? Vai arī dot balss komandas latviski tālrunim, “gudrajai mājai”, robotam putekļsūcējam, virtuālajiem asistentiem vai vēl kādai viedajai tehnoloģijai? Bieži vien tas gluži vienkārši nestrādā vai arī rezultāts ir kļūdains. Tas tādēļ, ka viedās tehnoloģijas latviešu valodu lielākoties neatpazīst. Taču tagad ikvienam no mums ir iespēja piedalīties projektā, lai palīdzētu viedajām tehnoloģijām iemācīties sazināties arī latviski.

Tehnoloģiju izstrādātājiem, kuri vēlētas savos produktos iespējot arī latviešu valodas saziņu, šobrīd trūkst izejmateriāla – proti, latviskās runas ierakstu. Tādēļ projektā “Balsu talka” cilvēki tiek aicināti kopīgi radīt šādu datu kopu.

Kā šī balsu talka notiek? Vispirms jāieiet mājaslapā “balsutalka.lv”. Tā pieejama gan datorā gan telefonā. Sameklē sadaļas “Runā” vai “Klausies”. Runāšanas sadaļā dators dod dažas frāzes, kas jāierunā. Spiež uz mikrofonu un ierunā. Spiež uz “Es piekrītu”, un esam ziedojuši savus balss ierakstus un veiksmīgi notalkojuši. Talkā var piedalīties, arī klausoties citu balsu ierakstus un novērtējot, vai tie patiešām atbilst ierunātajam tekstam.

“Ir vajadzīgi pēc iespējas vairāk akcentu, pēc iespējas vairāk dažādu izrunu. Jo dažādākas balsis būs, jo labāka atpazīšana pēc tam notiks,” stāstīja Latvijas Atvērto tehnoloģiju asociācijas vadītājs Pēteris Jurčenko.

Kopīgi izveidotā datu kopa nebūs maksas produkts. Tā būs brīvi pieejama ikvienam ražotājam, kurš vēlas radīt kādu viedo tehnoloģiju, kas sapratīs arī komandas latviešu valodā, un pelnīt – tirgojot tās arī Latvijas pircējiem.

“Šie balss paraugi būs zem atvērtās licences, viņi būs pieejami ikvienam. Lielie tehnoloģiju ražotāji varēs tos iekļaut savos produktos. Ja, piemēram, kāds mašīnas ražotājs izdomās uztaisīt valodu atbalstu komandām, tad līdzās poļu, igauņu valodām varēs iekļaut arī latviešu valodu un mašīnas to atpazīs,” skaidroja Jurčenko.

Pirmajās dienās ierunātas jau vairāk nekā 20 stundas.

Avots: LSM.lv. Pilnu rakstu lasīt šeit

Exploring the Role of Artificial Intelligence in Language Training

The use of artificial intelligence (AI) in language training has become increasingly popular in recent years. AI-powered language learning platforms and tools are being used by individuals and institutions alike to improve language proficiency and provide personalized language instruction.

One of the key benefits of using AI in language training is the ability to provide customized and personalized instruction. AI systems can analyse an individual’s language abilities and develop a tailored language learning plan that takes into account their strengths, weaknesses, and goals. This personalized approach allows for more efficient and effective language learning, as the learner is able to focus on the areas where they need the most help.

Another advantage of AI-powered language training is the ability to provide real-time feedback and corrections. Many language learning platforms and tools incorporate AI technology that can provide learners with instant feedback on their pronunciation, grammar, and vocabulary usage. This can help learners to quickly identify and correct their mistakes, improving their language skills over time.

Additionally, AI can be used to create engaging and interactive language learning experiences. For example, some language learning platforms use AI to generate personalized language lessons and activities, such as conversations with virtual language tutors or games and quizzes that reinforce language skills. These interactive experiences can help to keep learners engaged and motivated, improving the overall effectiveness of language training.

However, it’s important to note that AI is not a replacement for human language teachers. While AI can provide valuable assistance in language training, it is not capable of replicating the nuanced understanding and guidance that a human language teacher can provide. As such, the best approach to language training is to use AI as a supplement to human instruction, rather than a replacement.

In conclusion, AI has the potential to greatly enhance language training by providing personalized instruction, real-time feedback, and engaging learning experiences. While it is not a replacement for human language teachers, AI can be an effective tool for improving language skills and proficiency.

Vai emocijzīmes uzvarēs vārdus? Valodas nozīme digitālajā laikmetā

Vai emocijzīmes uzvarēs vārdus? Valodas nozīme digitālajā laikmetā

Mūsdienu tehnoloģijas ir būtiski mainījušas veidu, kā strādājam, mijiedarbojamies un sazināmies, raksta valodniece Aiga Veckalne. Digitālie mediji kļuvuši tik svarīgi, ka ir radies pat jauns valodas paveids — «digilekts». Tā spilgtākās iezīmes ir tīmeklī radušies jaunvārdi un emocijzīmes.

Digilekta attīstība un ietekme uz mutvārdu saziņu var palīdzēt mazināt ierobežojumus un psiholoģisko atsvešinātību, ko sabiedrībā savulaik veicinājusi prasme rakstīt un lasīt, kam trūkst mutvārdu spontanitātes. «Ieplānotu komunikāciju vairs neuzskata par ideālu, pat ne literatūrā,» norāda Āgneša Vešeleški.
Piemērs tam ir mobilo tālruņu romāns (cell phone novel) — literārs žanrs, kas ir īpaši populārs Japānā un Ķīnā un ko veido īsas nodaļas, kuras abonenti saņem e-pastā vai īsziņā.
Pat rakstīšana tviterī un komunikācija īsziņās liecina par valodas attīstību. Šāda saziņa padara mūs par labākiem un elastīgākiem rakstītājiem, runātājiem un komunikatoriem, uzskata valodniece Grečena Makaloha, grāmatas Interneta dēļ: izpratne par jaunajiem valodas noteikumiem un raidieraksta Lingthusiasm autore.
Tātad visi modes saīsinājumi, pieturzīmju nelietošana un emocijzīmes neapdraud valodu? Pasakiet to latviešu valodas skolotājiem un konservatīvi noskaņotajiem valodniekiem! «Valoda ir visnozīmīgākais un neparastākais cilvēces atvērtā koda projekts,» raksta Grečena Makaloha.
Mūsdienu digitālie iezemieši (digital natives) jeb cilvēki, kas uzauguši interneta vidē, būs vismaz divvalodīgi — gan literārajā valodā, gan neoficiālajā interneta valodā — un zinās, kad ir lietderīgi izmantot vienu vai otru veidu.
Tiesa, vērojot latviešu valodas tendences, mani bieži vien māc šaubas — vai tiešām spēs? Galvenā digilekta pazīme, kas tuvina tekstu runātajai valodai, ir emocijzīmju lietošana. Tās var palīdzēt piešķirt nozīmes kontekstu, nodomu, sajūtas. Īpaši populāras ir roku un seju piktogrammas, kas parāda resursus, ko jau izmantojam, lai paustu savus nodomus klātienē, proti, žestus.
Šie stilizēti grafiskie attēli radās Japānā 90. gados, lai aizvietotu daudzos hieroglifus un nepārprotami attēlotu emocijas un abstraktas idejas. Sejiņa ar prieka asarām 2015. gadā pat kļuva par Oksfordas vārdnīcas vārdu. Mūsdienās ir pieejama arī emocijzīmju enciklopēdija, automātiskais tulkotājs, top radoši darbi, un emocijzīmju valoda arvien vairāk kļūst par visiem saprotamu starptautisku valodu.
No vienas puses, šīs izmaiņas rada optimismu par tehnoloģiju potenciālu atbalstīt digitālo rakstpratību dažādās grupās. No otras puses, arvien biežāk raisa bažas par iespējamo kaitējumu ne tikai bērnu spējai lasīt iedziļinoties un koncentrēti, bet arī viņu runas prasmju attīstībai. Cilvēku agrīnā valodas pieredze arvien vairāk ir saistīta ar digitālo tekstu — tālruņos un planšetdatoros. Bet kāds 2020. gadā Itālijā veikts pētījums atklāja, ka ilgāks digitālo ierīču izmantošanas laiks saistīts ar zemāku mīmikas un žestikulācijas prasmju attīstību bērniem.
Vecāku un skolotāju nozīme valodas attīstības un lasītprasmes veicināšanā ir ļoti svarīga, tādēļ aprūpētājiem būtu jāsniedz informācija gan par to, cik svarīgi ir lasīt bērniem drukātā veidā, gan par to, kā vislabāk pārvaldīt un atbalstīt bērnu digitālo ierīču lietošanu. Izmantojot dialoga veida lasījumu, mijiedarbojoties ar tekstu, vecāki veicina bērnu izpratni, uzdod jautājumus un palīdz bērniem koncentrēties un saistīt tekstus ar savu dzīvi. Šāda mijiedarbība bagātina bērnu valodas prasmes, veido viņu skatījumu uz lasīšanu kā uzmanības laiku, kā arī palielina viņu prieku un interesi par lasīšanu.
Datorizētās saziņas ietekmē notiek arī citas izmaiņas, piemēram, pamazām izzūd rakstīšana rokrakstā.
Ir valstis, kur skolēniem mācībās arvien mazāk jāraksta ar roku vai tas nav jādara vispār, lai gan šādai rakstīšanai ir daudz nozīmīgu attīstības ieguvumu. Bet cilvēces attīstība ir atkarīga no valodas prasmēm un spējas komunicēt jaunas un sarežģītas idejas, lai integrētu tās kultūrā un sociālekonomiskajās norisēs. Lai sadarbotos, cilvēkiem ir nepieciešama valoda.
Taču nav viena pareiza valodas lietošanas veida. Arī tiešsaistē. Mēs varam lietot valodu atšķirīgi, un tas veicina sociālo mijiedarbību.

Avots: Tele2. Visu rakstu lasiet šeit.

Eiropā izveidota platforma, kas palīdzēs nojaukt valodu barjeru

Eiropā izveidota platforma, kas palīdzēs nojaukt valodu barjeru

Eiropas Savienības finansētā projektā “SELMA” izveidotā platforma palīdzēs nojaukt valodu barjeras, “Latvijas Avīzei” apliecināja Latvijas Universitātes Mākslīgā intelekta laboratorijas vadošais pētnieks Guntis Bārzdiņš.

Latvijas Universitātes Matemātikas un informātikas institūts (LU MII) sācis līdzdalību Eiropas Savienības pētniecības un inovāciju programmas “Horizon 2020” projekta “SELMA” īstenošanā.

Projekta laikā ar dažādu valstu institūciju palīdzību tiks izveidota daudzvalodu atvērtā pirmkoda platforma, kurā, izmantojot dziļo mašīnmācīšanos, izstrādās jaunas metodes mākslīgā intelekta valodas modeļu iegūšanai. Vienkāršoti runājot, īpašā platformā žurnālisti un mediju analītiķi varēs pētīt tekstuālo un audiovizuālo saturu.

Kā “Latvijas Avīzei” skaidroja LU MII Māk­slīgā intelekta laboratorijas vadošais pētnieks Guntis Bārzdiņš, “SELMA” projektā izveidotā platforma palīdzēs nojaukt valodu barjeras.

“Vēsturiski kvalitatīvas runas transkriptēšanas un tulkošanas tehnoloģijas bija pieejamas tikai lielajām kompānijām, taču jaunākās daudzvalodu dziļās mašīnmācīšanās metodes nepieciešamos valodas modeļus padara pieejamus ikvienam. Projekts lielākoties ir vērsts uz šo visjaunāko tehnoloģiju pielāgošanu mediju vajadzībām, lai atvieglotu to ieviešanu ikdienas darba procesos.”

Līdztekus liela apjoma ziņu tulkošanai un automātiskai grupēšanai pa tēmām, viens no interesantākajiem projekta virzieniem būs automātiska videosižetu tulkošana, kas būtībā ļaus tulkot pat veselas filmas.

Videosižeta tulkošana ietvers vairākus soļus – oriģinālo audio transkriptēšanu, teksta tulkošanu, dažādu balsu runas sintēzi no teksta. Turklāt šie soļi būs jāveic sinhroni, lai tulkotā runa sakristu ar runātāja lūpu kustībām.

Izklausās kā kaut kas līdzīgs jau valodu tehnoloģiju uzņēmuma “Tilde” veidotajām sistēmām, tostarp iespējai ierunātu audiofailu transkriptēt žurnālista vietā.

Diemžēl žurnālistiem sistēma vēl nav īsti izmantojama. Bārzdiņš skaidro, ka runas transkriptēšanas sistēmu kļūdām ir divi avoti – neskaidri izrunāts teksts un jauni, sistēmai nezināmi vārdi – pārsvarā personu uzvārdi un reti lietoti termini.

“Atšķirībā no “Tildes” “SELMA” tehnoloģijas pamatā ir iespēja lietotājam interaktīvi izlabot sistēmas pieļautās kļūdas, un šie labojumi automātiski papildinās “SELMA” vārdu krājumu ar jaunu terminu un uzvārdu pareizrakstību, tādējādi uzlabojot gan tālāko transkripciju, gan tulkošanu, gan runas sintēzi.”

Platforma spēs apstrādāt desmit miljonus satura vienību dienā. Satura vienība varēs būt gan videosižets, gan preses paziņojums dažādos kanālos, gan citas ziņas. Izstrādātāji skaidro, ka platformas mākslīgā intelekta komponenti tiks regulāri pilnveidoti un sistēma spēs pašmācīties.

Svarīgi, ka platforma vispirms apkopos un analizēs saturu oriģinālvalodā, nevis izmantos angļu valodu kā starpniekvalodu. Savukārt tulkošana un runas sintēze citās valodās tiks veikta pēc pieprasījuma.

Projektu gandrīz 3,5 miljonu apmērā pilnībā finansē Eiropas Savienība, taču ikviens no partneriem, tostarp LU, jau iepriekš daudzus gadus strādājuši šīs jomas attīstīšanai.

Bārzdiņš pārliecināts, ka visu “SELMA” partneru kopējās investīcijas šīs jomas attīstīšanai ir mērāmas desmitos miljonu eiro.

Avots: LA.lv. Visu rakstu lasiet šeit.