'Angen gwell cydweithio' i wireddu potensial AI yn y Gymraeg

Disgrifiad o'r llun, Tom Burke o gwmni Haia ar Ynys M么n, sydd eisoes yn defnyddio deallusrwydd artiffisial

Mae datblygwyr technoleg yn galw am well cydweithio yng Nghymru er mwyn gwneud y mwyaf o'r cyfleoedd y gallai deallusrwydd artiffisial (AI) ei gynnig i'r Gymraeg.

Mae gallu'r sgwrsfot ChatGPT i gyfathrebu yn yr iaith yn dangos bod yr iaith yn "rhan o'r chwyldro AI", yn 么l ymchwilwyr.聽

Ond os yw'r "potensial enfawr" i gael ei wireddu, medden nhw, mae angen yr hawl i ddefnyddio'r deunydd Cymraeg sydd ar hyn o bryd o dan hawlfraint, i hyfforddi cyfrifiaduron.

Mae Llywodraeth Cymru'n dweud y bydd eu strategaeth Technoleg yn y Gymraeg yn cael ei hadnewyddu'n fuan.

'Gwallau o hyd'

Un busnes sydd eisoes yn defnyddio deallusrwydd artiffisial i gynnig gwasanaeth dwyieithog ydy cwmni Haia o Ynys M么n.

Mae'r cwmni'n trefnu digwyddiadau ar y we ac yn defnyddio meddalwedd cyfieithu ar y pryd i alluogi pobl i siarad yn Gymraeg neu Saesneg gydag isdeitlau.聽

Ond yn 么l un o'i sylfaenwyr, Tom Burke, gallai eu gwasanaeth fod yn well petai rhagor o ddata Cymraeg ar gael.聽

"Un o'r problemau rydan ni'n ei gael ydi pa mor gywir ydi'r cyfieithiad," meddai. "Os ti'n cymharu efo Almaeneg neu Sbaeneg, mae'r data yn y Gymraeg yn fychan.

Disgrifiad o'r llun, Mae rhaglenni dealltwriaeth artiffisial eisoes yn gallu defnyddio'r Gymraeg, ond mae'n gamau cynnar o hyd

"Yn aml, 'dan ni'n gweld gwallau yn y cyfieithiad neu'r trawsgrifiad, ac un ffordd o wella hynny ydi cael defnyddio'r cyfoeth o ddata sydd yna yn Gymraeg."

Mae deallusrwydd artiffisial iaith yn gweithio gyda modelau iaith cyfrifiadurol, sy'n defnyddio symiau enfawr o ddata fel gwefannau, llyfrau ac erthyglau i ddarogan pa eiriau sy'n tueddu i ddilyn ei gilydd.

Gallai data Cymraeg hefyd gynnwys rhaglenni radio a theledu.

"Petaen ni'n medru cael gafael ar y data yna, ei ddefnyddio i hyfforddi'r modelau iaith, yna buasai'r modelau iaith Cymraeg yn dod yn fwy cywir," meddai Mr Burke.

"Yn y tymor hir bydd hynny'n galluogi cwmn茂au newydd i ffurfio, galluogi arloesi, a gallai Cymru ddod yn ganolbwynt ar gyfer technolegau iaith."

'Adlewyrchu realiti Cymru'

Un o'r sefydliadau sy'n helpu i hyfforddi a gwerthuso modelau iaith mawr yng Nghymru yw Canolfan Bedwyr ym Mhrifysgol Bangor.

Lansiodd yr Uned Technolegau Iaith yno brototeip sgwrsfot Cymraeg, Macsen, wyth mlynedd yn 么l gan ddefnyddio technolegau lleferydd-i-destun a chynhyrchu iaith naturiol.

Maen nhw bellach yn ei redeg gyda ChatGPT, a ddatblygwyd gan OpenAI yn yr UDA.

Yn ogystal 芒'r potensial economaidd mae pennaeth yr uned, Gruffydd Prys, yn teimlo y dylai deunydd Cymraeg fod ar gael er mwyn helpu i wneud y dechnoleg yn fwy "addas ar gyfer anghenion y Gymraeg a Chymru yn gyffredinol".

Disgrifiad o'r llun, Dylai deunydd Cymraeg fod ar gael i helpu i wneud y dechnoleg yn fwy addas ar gyfer anghenion y Gymraeg, meddai Gruffydd Prys

"Un o'r pethau y gallwn ei wneud i wella ansawdd deallusrwydd artiffisial yw galluogi'r data sydd allan yna i fod ar gael o dan drwyddedau caniataol, fel bod y modelau'n adlewyrchu realiti Cymru ac nad ydyn nhw'n fodelau rhy Americanaidd neu ryngwladol," meddai Mr Prys.

Dywedodd Tom Burke fod angen i fynediad at y data ddigwydd yn fuan.

"'Dan ni eisoes wedi colli 12 mis o amser arloesi, a'r hyn fydd yn digwydd yn y pen draw yw y byddwn ni ar ei h么l hi," meddai.

"Ar y pwynt y gallwn ni ddechrau ei ddefnyddio, bydd gweddill y byd wedi ei ddatblygu hefyd.

"Mae gennym ni'r sefyllfa wych hon, mae gennym ni'r wlad ddwyieithog hon. Mae gennym ni brifysgol wych fel Bangor yn gweithio ar y dechnoleg hon. Mae angen i ni wneud hyn nawr fel y gall cwmn茂au ddechrau ei ddefnyddio a mynd allan yno."

'Wir yn bwysig'

Dywedodd y gweinidog sy'n gyfrifol am y Gymraeg yn Llywodraeth Cymru, Jeremy Miles AS, bod deallusrwydd artiffisial yn y Gymraeg "wir yn bwysig".

"Mae'n rhan bwysig o'r strategaeth Technoleg yn y Gymraeg sydd gyda ni eisoes," meddai.

"Ni ar fin adnewyddu honno ar gyfer y cyfnod nesaf.

"Dros y blynyddoedd diwethaf ni wedi gwario 拢2m ar sicrhau bod y Gymraeg reit yng nghanol yr agenda hon, ac mae'n parhau'n flaenoriaeth bwysig i ni yn y dyfodol."