Google Translate AI finnur upp sitt eigið tungumál til að þýða með

Google Translate er að verða gáfulegra. Þýðingartólið á netinu byrjaði nýlega að nota tauganet til að þýða á milli nokkurra vinsælustu tungumála þess – og kerfið er nú svo snjallt…

New Scientist Default Image

Google Translate er að verða gáfulegra. Þýðingartólið á netinu byrjaði nýlega að nota tauganet til að þýða á milli nokkurra vinsælustu tungumála þess – og kerfið er nú svo snjallt að það getur gert þetta fyrir tungumálapör sem það hefur ekki verið sérstaklega þjálfað í. Til að gera þetta virðist það hafa búið til sitt eigið gervi tungumál.

Hefðbundin vélþýðingarkerfi brjóta setningar í orð og orðasambönd og þýða hverja fyrir sig. Í september kynnti Google Translate nýtt kerfi sem notar taugakerfi til að vinna heilar setningar í einu, sem gefur því meira samhengi til að finna út bestu þýðinguna. Þetta kerfi er nú í notkun fyrir átta af algengustu tungumálapörunum sem Google Translate virkar á.

Þrátt fyrir að taugavélþýðingarkerfi séu fljót að verða vinsæl, virka flest aðeins á einu tungumáli, svo mismunandi kerfi þarf til að þýða á milli annarra. Með smá fikti hefur Google hins vegar stækkað kerfið sitt þannig að það geti séð um mörg pör – og það getur þýtt á milli tveggja tungumála þegar það hefur ekki verið beint þjálfað til að gera það.

Til dæmis, ef taugakerfi hefur verið kennt að þýða á milli ensku og japönsku, og ensku og kóresku, getur það einnig þýtt á milli japönsku og kóresku án þess að fara fyrst í gegnum ensku. Þessi möguleiki gæti gert Google kleift að stækka kerfið fljótt til að þýða á milli fjölda tungumála.

„Þetta er mikið framfarir,“ segir Kyunghyun Cho við New York háskóla. Lið hans og annar hópur við Karlsruhe Institute of Technology í Þýskalandi hafa sjálfstætt gefið út svipaðar rannsóknir sem vinna að taugaþýðingarkerfum sem geta séð um margar tungumálasamsetningar.

Nýtt sameiginlegt tungumál

Rannsakendur Google telja að kerfið þeirra nái þessari byltingu með því að finna sameiginlegan grundvöll þar sem setningar með sömu merkingu eru sýndar á svipaðan hátt óháð tungumáli – sem þeir segja að sé dæmi um „millimál“. Í vissum skilningi þýðir það að það hefur búið til nýtt sameiginlegt tungumál, þó það sé sérstakt við þýðingarverkefnið og ekki læsilegt eða nothæft fyrir menn.

Cho segir að þessi nálgun, sem kallast núllskotsþýðing, skili sér samt ekki eins vel og einfaldari nálgunin að þýða í gegnum millimál. En sviðið er í örum framförum og niðurstöður Google munu vekja athygli rannsóknarsamfélagsins og iðnaðarins.

„Ég efast ekki um að við munum geta þjálfað eitt taugavélþýðingarkerfi sem virkar á 100 plús tungumálum í náinni framtíð,“ segir Cho.

Google Translate styður sem stendur 103 tungumál og þýðir yfir 140 milljarða orð á hverjum degi.

Munu mannlegir þýðendur verða atvinnulausir fljótlega? Taugaþýðingartækni getur nú þegar gert gott starf fyrir einfalda texta, segir Andrejs Vasiļjevs, annar stofnandi tæknifyrirtækisins Tilde, sem er að þróa taugaþýðingarþjónustu á milli lettnesku eða eistnesku og ensku. En góður mannlegur þýðandi skilur merkingu frumtextans, sem og stílfræðilega og orðafræðilega eiginleika hans, og getur notað þá þekkingu til að gefa nákvæmari þýðingu.

„Til að passa við þessa mannlegu hæfileika verðum við að finna leið til að kenna tölvum grunnþekkingu um heiminn, sem og þekkingu á tilteknu sviði þýðingar og hvernig á að nota þessa þekkingu til að túlka textann sem á að þýða,“ segir Vasiļjevs.

Related Posts