Prečo je zívanie niekedy nákazlivé?
Prečo zívame, keď vidíme zívať niekoho iného? Vedci majú zaujímavé vysvetlenie.
Umelá inteligencia hovorí čoraz lepšie po slovensky. Jazykovedný ústav Ľudovíta Štúra Slovenskej akadémie vied (JÚĽŠ SAV) predstavil nový slovenský jazykový model Qwen3-14B-sk.
Veľké jazykové modely (tzv. LLM, z angl. Large Language Models) sú základom moderných AI asistentov umelej inteligencie, ako sú ChatGPT alebo Claude.
Sú to systémy umelej inteligencie trénované na obrovských množstvách textu. Naučia sa tak porozumieť jazyku a vytvárať na zadané otázky zmysluplné odpovede.
Kľúčové je, že model musí byť trénovaný na texte v danom jazyku, inak píše lámanou gramatikou alebo jazyk úplne odmieta. Menšie jazyky vrátane slovenčiny nebývajú v globálnych modeloch veľmi dobre zastúpené. Preto je vznik slovenského modelu dôležitý krok.
Qwen3-14B-sk je slovenská verzia veľkého jazykového modelu Qwen3 so 14 miliardami parametrov. Model vznikol v spolupráci Ústavu umelej inteligencie Fakulty elektrotechniky a informatiky Technickej univerzity v Košiciach, Centra spoločenských a psychologických vied SAV, organizácie ČZ, o. z., a Jazykovedného ústavu Ľudovíta Štúra SAV. Ide o inštrukčný model, ktorý bol vytrénovaný na slovenských textoch.
Číslo 14B v názve označuje počet parametrov, akýchsi „neurónových spojení“ modelu. Pre porovnanie, modely s väčším počtom parametrov sú zvyčajne schopnejšie, ale aj náročnejšie na výpočtové zdroje.
Trénovacie dáta zahŕňajú korpus Araneum Slovacum VII Maximum (zbierka slovenských textov), Slovník slovenského jazyka a Encyclopaediu Belianu. Ide o rozsiahle a kvalitné slovenské zdroje od webových textov cez akademické slovníky až po encyklopedické poznatky. To dáva modelu pevný jazykový aj obsahový základ.
Výpočtové zdroje poskytol superpočítač PERUN Technickej univerzity v Košiciach a talianske centrum CINECA v rámci národného prístupu Leonardo s koordináciou Výpočtového strediska SAV.
Model je dostupný pod licenciou Apache 2.0, čo znamená, že ho môže voľne využívať akademická komunita aj firmy.
Vznik Qwen3-14B-sk signalizuje, že slovenčina nezostáva jazykom, ktorý umelá inteligencia chápe len napoly. Stáva sa jazykom, v ktorom AI naozaj myslí.
Text: Zázračná planéta
Foto: Facebook/Jazykovedný ústav Ľudovíta Štúra
Prečo zívame, keď vidíme zívať niekoho iného? Vedci majú zaujímavé vysvetlenie.
Presnejšie, stačilo by nájsť tisíc dospelých BUDDY dobrovoľníkov, aby tínedžeri vyrastajúci mimo rodiny nemuseli byť na svoje problémy sami a mali
Čo patrí medzi najnebezpečnejšie znečisťujúce látky patria výplody z dopravy a priemyslu?
Kapela Para rok už tradične ukončuje s charitatívnym rozmerom – populárnymi PARAgrafikami.
Každá inovácia má svoj dôvod. Aj to, prečo ľudia tak radikálne vymenili svoje nástroje za iné, sa konečne dočkalo vysvetlenia.
Vedci síce nové zvieratá objavujú každý deň, ale tisícky z nich zostávajú v ohrození. tu je niekoľko z nich, ktoré majú takú smolu, že sa dostal
Finalista zo Slovenska získal v prestížnej súťaži stromov druhé miesto.
Tulene sa niekedy prevrátia na chrbát a veselo sa tľapkajú po bruchu. Vyzerajú ako spokojní tučkovia, ktorí si vychutnávajú slnko. Realita je však in
7. ročník benefičného turnaja ZSE a Asociácie APPA na ihrisku v Penati Golf Resorte v Šajdíkových Humenciach sa niesol v duchu pomoci aj mimoriadne
Nie každá pohroma udrie náhle a nečakane. Niektoré sa plížia pomaly a nenápadne. Táto bola jednou z nich.
SPORTMEDIA, S.R.O.
Lamačská cesta 45
841 03 Bratislava
sportmedia@sportmedia.sk
www.sportmedia.sk