LLAMA-KRIKRI: NJË REVOLUCION NË TEKNOLOGJINË GREKE TË INTELIGJENCËS ARTIFICIALE.
- Agjencia Telegrafike Vox
- Feb 17
- 7 min read

Athinë, Greqi | Instituti për Përpunimin e Gjuhës dhe të Fjalës (ILSP) në Qendrën Kërkimore Athena - i vetmi institut në Greqi që ka zhvilluar makineri të afta për t'iu përgjigjur pyetjeve dhe për të zgjidhur problemet duke imituar inteligjencën njerëzore - sapo ka lançuar modelin e tij të dytë të madh të gjuhës (LLM), Llama-Krikri.
Llama-Krikri ndjek gjurmët e modeles së parë gjuhësore të institutit, Meltemi.
Ndërsa mund të mos rivalizojë shkallën e DeepSeek ose ChatGPT, ai kryen të njëjtat detyra themelore.
Një bisedë me ekipin pas saj ndihet si një zhytje e thellë në botën magjepsëse të rrjeteve nervore artificiale, të cilat përpunojnë dhe gjenerojnë me mjeshtëri gjuhën njerëzore.
Është njësoj si të vendosni modelin e gjuhës që të analizojë të dhënat tuaja të ruajtura dhe t'i përdorë ato si fletë mashtrimi për të gjeneruar përgjigje
Pse emri Llama-Krikri?
“Është një lojë e lidhjes së fjalëve”, shpjegon me buzëqeshje z. Vassilis Katsouros, drejtor i ILSP në Qendrën Kërkimore Athena.
“Emri vjen nga modeli bazë që përdorëm - modeli me burim të hapur Llama 3.1 nga Meta - i kombinuar me ekuivalentin grek të llamës, kri-kri (një lloj dhie e egër vendase në Kretë)”.
Llama-Krikri është dukshëm më i vogël në shkallë llogaritëse se DeepSeek, por sa?
“Nëse rrjeti nervor i DeepSeek ka 671 miliardë parametra, nga të cilët 37 miliardë janë aktivizuar në bazë të pyetjes së përdoruesit, modeli ynë ka vetëm 8 miliardë parametra”, shpjegon z. Katsouros.
E thënë thjesht, duke e përkthyer gjuhën greke në numra - meqenëse kompjuterët përpunojnë numra, jo fjalë - Llama-Krikri e përfaqëson atë duke përdorur 8 miliardë vlera numerike.
“Është një shkallë e ndryshme investimi”, shton ai. Modelet e gjuhëve të nivelit të lartë kërkojnë sasi të mëdha të dhënash, fuqi të madhe llogaritëse dhe burime të konsiderueshme financiare.
Ndihmës dixhital: Llama-Krikri realizon gjithçka që bëri Meltemi - dhe bën një punë shumë më të mirë.
Çfarë ka bërë konkretisht Meltemi? Ai fuqizoi komunitetet greke akademike, kërkimore dhe të biznesit për të ndërtuar asistentët e tyre dixhitalë.
“Ndërsa nuk ofron një shërbim për t'iu përgjigjur pyetjeve të drejtpërdrejta nga publiku i gjerë, ai lejon këdo që ka disa njohuri programore që t'i përshtatë ato sipas nevojave të tyre, të paraqesë pyetje dhe të marrë përgjigje bazuar në të dhënat e veta”, shpjegon z. Sokratis Sofianopoulos, i cili, së bashku me z. Prokopis Prokopidis, Georgios Paraskevopoulos, Leon Voukoutis - allaspsociates dhe Dimitris Roucussis Llama-Krikri.
“Është njësoj si të vendosni modelin e gjuhës për të shoshitur të dhënat tuaja të ruajtura dhe për t'i përdorur ato si një fletë mashtrimi për të gjeneruar përgjigje”, shton ai.
Dhe këto përgjigje vijnë në greqishten e rrjedhshme moderne si dhe në anglisht.
“Meltemi bëri një ndikim të madh - dhjetëra mijëra shkarkime në Hugging Face, një platformë ku zhvilluesit e AI ndajnë kodin.
Ai u shkarkua nga studentë dhe akademikë, u përdor në aplikime të panumërta dhe projekte kërkimore, nxiti aktivitetin kërkimor në Greqi dhe rriti produktivitetin në ndërmarrjet e vogla dhe të mesme.
Ofroi një zgjidhje të përballueshme për ekzekutimin e shpejtë të projektit”, thotë z. Sofianopoulos.
Përveç kësaj, instituti ka mbështetur organizatat publike dhe bizneset në ndërtimin e asistentëve të tyre dixhitalë.
“Brenda kuadrit të Qendrave Evropiane të Inovacionit Dixhital (EDIHs), ne punojmë me kompani që kërkojnë përshtatje të personalizuara të modelit tonë gjuhësor për t'iu përshtatur nevojave të tyre specifike”, shton z. Katsouros.
Pra, çfarë përmirësimesh sjell Llama-Krikri?
“Ka një memorie shumë më të fortë - nuk i humbet gjurmët gjatë bisedave të gjata.
Ndërsa modeli i mëparshëm mund të kujtonte deri në 8000 fjalë dhe të mbante një dialog për vetëm disa minuta, Llama-Krikri mund të mbajë mend deri në 128000 fjalë - një libër i tërë prej 250 faqesh - dhe mund të trajtojë një sekuencë pyetjesh të shumta pa harruar atë që u tha në fillim.
Mund të përpunojë vëllime më të mëdha teksti për të gjeneruar përgjigjet e tij. Ai prodhon tekst me cilësi më të lartë; shkruan në sistemin politonik, mund të kompozojë në greqishten e vjetër dhe përkthehet në greqishten moderne - diçka që modeli i mëparshëm nuk ishte i trajnuar për të bërë.
Ai gjithashtu shkruan kode më të mira, pasi modelet nuk kufizohen vetëm në gjuhën natyrore - ata gjithashtu shkruajnë gjuhë kompjuterike.
Për më tepër, ai zgjidh problemet matematikore më saktë dhe shfaq arsyetim më të fortë. Me fjalë të tjera, ai mund të kryejë detyra komplekse që kërkojnë disa hapa të ndërmjetëm të të menduarit logjik”, shpjegon z. Katsouros.
Në të njëjtën kohë, ekipi hulumtues po krijon dhe publikon një mori burimesh gjuhësore, duke përfshirë grupe të dhënash që përkthejnë të dhënat e gjuhës angleze në greqisht.
Kjo përpjekje mundëson një vlerësim të plotë të performancës së modelit të gjuhës greke dhe e gjithë kjo vihet në dispozicion të hapur.
Siç thotë znj. Maria Giagkou, një bashkëpunëtore shkencore në institut, “Meltemi dhe Llama-Krikri janë modele me burim të hapur, që do të thotë se çdo studiues apo profesionist i industrisë mund të ekzaminojë dhe personalizojë lirisht punën e tyre.
Kjo është fuqia e burimit të hapur. Në të kundërt, modeli i OpenAI është i mbyllur – ju merrni atë që ju jep, pa asnjë mundësi për t'iu përshtatur nevojave tuaja specifike”.
Z. Katsouros shpjegon më tej se ekosistemi grek i ndërmarrjeve të vogla dhe të mesme ka nevojë për teknologji në greqisht që plotëson kërkesat dhe aftësitë e tij unike financiare.
Për më tepër, siç shton z. Sofianopoulos, një kompani greke nuk ka nevojë për ChatGPT për të mbështetur shërbimet e saj.
Ajo ka nevojë për një model më të vogël - ose ndoshta edhe një të dytë ose të tretë - për të caktuar detyra specifike, të menaxhuara të gjitha brenda për të shmangur rrezikun e rrjedhjeve të të dhënave dhe tarifat e mëdha të ngarkuara nga OpenAI.
Kjo është veçanërisht e rëndësishme kur shërbimet ofrohen nëpërmjet abonimit, gjë që është thelbësore për të garantuar sigurinë.
Në modele të tilla, kostoja bazohet në numrin e segmenteve të fjalëve të krijuara nga çdo pyetje dhe përgjigje.
Sa më shumë segmente të ndahet një fjalë, aq më i lartë është kostoja. OpenAI dhe Anthropic shpesh zbërthejnë çdo fjalë greke në nënfjalë të shumta - ndonjëherë edhe karakter pas karakteri - duke gjeneruar kështu tekstin grek duke i bashkuar këto fragmente së bashku.
“Në qasjen tonë, ne i ndajmë fjalët greke në segmentet më të mëdha të mundshme, duke ulur ndjeshëm koston llogaritëse. Mesatarisht, një fjalë greke e ndajmë në 1.5 segmente, ndërsa modelet e tjera i ndajmë në 2.5, 6 apo edhe 7 segmente”, shpjegon ai.
Dietë kulturore: Por këto nuk janë të vetmet arsye që na duhen modele të gjuhës greke.
“Gjuha jonë mbart kulturën tonë dhe formon mënyrën se si ne mendojmë dhe komunikojmë në greqisht.
Keni nevojë për një shërbim që, kur bëni një pyetje specifike kulturore, të thoni: Rekomandoni një mëngjes të shëndetshëm, të përgjigjet në mënyrë të përshtatshme në vend që të sugjerojë diçka si fasulet me proshutë, që është një koncept britanik i mëngjesit.
Është thelbësore të trajnohen modele të mëdha gjuhësore - dhe të gjitha teknologjitë gjuhësore - në tekste të shkruara fillimisht në greqisht dhe jo në përkthime nga gjuhë të tjera”, shpjegon znj. Giagkou.
“Është gjithashtu një çështje e mbijetesës dixhitale për gjuhën tonë. Ne e dimë se gjuhët e pashkruara mund të zhduken; sot, gjuhët pa prani dixhitale gjithashtu do të zhduken.
Që një gjuhë të mbijetojë, ajo duhet të ketë një gjurmë dixhitale, që do të thotë të mbështetet nga teknologjitë gjuhësore, duke përfshirë modele të mëdha gjuhësore.
Dhe për shkak se ne jemi një treg shumë i vogël, kompanitë e mëdha tregojnë pak interes tregtar për gjuhën greke. Nëse ne grkeët nuk investojmë në teknologjitë e gjuhës greke, askush tjetër nuk do ta bëjë”, tha ajo.
Një DeepSeek Evropian?: A mundet Evropa të zhvillojë një DeepSeek?
Z. Katsouros përgjigjet: “Sigurisht që mund. DeepSeek përdori teknika llogaritëse që janë të njohura në komunitetin e kërkimit.
Metoda të ngjashme janë adoptuar nga kompania franceze Mistral AI, një nga firmat kryesore evropiane në zhvillimin e modeleve gjuhësore. Ajo që nevojitet është më shumë eksperimentim, trajnim i vazhdueshëm, akses në burime, punë e palodhur dhe përshtatje e vazhdueshme me përparimet më të fundit teknologjike.
Me modelet me burim të hapur, përpjekja ndahet - francezët bazohen në punën e kinezëve, grekët ndërtojnë në frëngjisht, e kështu me radhë - kështu që një model i madh gjuhësor evropian mund të shfaqet vërtet dhe të ketë një ndikim të rëndësishëm.
Megjithatë, Evropa duhet të mbetet e përfshirë në mënyrë aktive dhe të zhvillojë një kuadër rregullator më të balancuar për të drejtat e autorit të të dhënave - ndoshta duke lejuar 10% ose 20% përdorim falas, të ngjashme me lejimet e bëra për qëllime arsimore.
Presidenti francez Emanuel Makron dikur vërejti se në Evropë, ne rregullojmë shumë dhe inovojmë shumë pak”.
“Tani për tani, është formuar një aleancë evropiane për teknologjitë gjuhësore, me 17 vende që marrin pjesë deri më tani.
Qëllimi është mbledhja e të dhënave gjuhësore dhe zhvillimi i modeleve të reja gjuhësore në shkallë të gjerë.
Për më tepër, dy projekte të mëdha evropiane janë financuar për të krijuar një model shumëgjuhësh që do të mbështesë të gjitha gjuhët zyrtare evropiane në mënyrë të barabartë, në përputhje me politikën shumëgjuhëshe të Evropës”, thotë znj. Giagkou.
Z. Sofianopoulos është më pak optimist, duke na kujtuar se Evropa nuk ka zhvilluar ende arkitektura krejtësisht të reja për modele të mëdha gjuhësore - të paktën jo në një shkallë që mund të konkurrojë me iniciativat nga SHBA dhe Kina.
Një nismë që adreson një pjesë të kësaj sfide është Pharos, fabrika greke e IA, një projekt që përfshin shumë organizata vendase kërkimore dhe akademike.
Partnerët kryesorë përfshijnë Infrastrukturat Kombëtare për Kërkim dhe Teknologji (GRNET), Qendrën Demokritos për Kërkime Shkencore, Universiteti Teknik Kombëtar i Athinës (NTUA), Athena RC dhe Korporata Helenike e Aseteve dhe Pjesëmarrjeve. Pharos do të funksionojë duke përdorur burime llogaritëse nga kompjuteri me performancë të lartë (HPC) Daedalus.
“Sa më shumë njerëz të përfshihen, aq më shpejt do të shohim rezultate novatore”, tha z. Katsouros.
Nga z. Erton Duka.
© Copyright | Agjencia Telegrafike Vox
Ne të njohim me botën | www.007vox.com | Burimi yt i informacionit
Comments