Koubský: Vývojářům došla data z internetu, musí použít umělá. Al se poprvé dozví i o vlastní existenci

Vývojářům generativních AI systémů docházejí data, která potřebují k trénování svých systému. Dosud všechny velké AI chatboty, jako je chatGPT, Google Bard nebo Claude, pracovali s daty, která firmy stáhly z internetu. Šlo o konverzace na sociálních sítích, obsah Wikipedie a dalších encyklopedií, digitalizované knihy, texty z blogů a další zdroje.

Praha 12:52 21. července 2023 Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Zavřít

Jak bude vypadat komunikace dvou AI systémů? | Foto: Steve Johnson | Zdroj: Unsplash | Licence Unsplash,©

Většinu použitelných dat už využili, a navíc narážejí na stále hlasitější protesty jejich autorů a vlastníků. Proto se začínají obracet k synteticky vytvořeným údajům, které připravují specializované AI systémy.

Přehrát

00:00 / 00:00

Poslechněte si celý pořad Online Plus Davida Slížka.

O tématu psal podrobně deník The Financial Times. Tvůrci AI systémů teď podle něj potřebují hlavně specializovaná data z různých oborů. Pořídit si je od firem nebo si je nechat zpracovat lidskými autory by vyšlo příliš draho.

Proto je nechávají generovat strojově. Data mohou vznikat například tak, že je vytvářejí dva AI systémy, které spolu „mluví“ o nějakém tématu, například o matematice. Lidský matematik pak jen zkontroluje, zda nebyly v konverzaci chyby. Na těchto datech se pak trénují další AI systémy.

Cesta nouze

Podle Petra Koubského, redaktora Deníku N, jde o postup, který by vývojáři nezvolili dobrovolně a který bude mít spíše svá negativa než pozitiva.

One researcher said using computer-made 'synthetic data' would help speed up the path to superintelligent AI that can 'teach themselves'. https://t.co/j6w5A0Jt8u pic.twitter.com/1osCvpsozP
— Financial Times (@FinancialTimes) July 19, 2023

„Myslím si, že syntetická data mají hlavně nevýhody. Není to přirozený lidský jazyk, na kterém by se jazykové modely měly učit. Je tam veliké riziko, že kvalita bude klesat. To riziko je dobře známé, ale zejména copyrightové důvody vedou k tomu, že se k tomu musí přistupovat. Rozhodně to ale není řešení, které by si ti vývojáři zvolili dobrovolně. Jsou k němu dotlačeni, takže takové řešení z nouze,“ míní.

Internet není bezedný

Všechny velké jazykové modely se zatím učily na datech, která neobsahovala žádné zmínky o nich samých. Počítalo se s tím, že bude zajímavé, až se dozví, že existuje něco jako velký jazykový model.

Rizika umělé inteligence přeceňujeme především kvůli novosti technologie, myslí si novinář Koubský

Číst článek

„Pokud se učí na něčem, co není přirozená lidská řeč, dá se to sice mírnit kontrolou, což ale zase naráží na kapacitní možnosti lidí, kteří s tím pracují. Myslím si, že v tuto chvíli je to velký problém, a ne kvůli tomu, že se modely dovědí o své vlastní existenci. V každém případě: tohle by se modely učit neměly. Hodně chytrých lidí si teď velmi intenzivně láme hlavu, co s tím a jak nedostatek odstranit,“ říká.

The Financial Times také píše, že dnes už vývojáři potřebují hlavně specializovaná data z konkrétních úzce profilovaných vědních oborů, jako je matematika apod.

Jsou to informace, které nemohou nikde na internetu najít, a právě i proto používají syntetická data, která si nejdřív vloží do jednoho AI systému a ten pak konverzuje s druhým. Z toho vznikají data, která by normálně jinde neměli.

„Tohle se asi nedá udělat jinak. Věřme, že vědí, co dělají, ale je to méně dobrá situace, než kdyby měli obrovskou zásobárnu volně použitelných dát vytvořených lidmi,“ dodává.

Poslechněte si celý pořad Online Plus Davida Slížka v audiozáznamu, který najdete na začátku článku. Dále se dozvíte o tom, proč herci bojkotují AI v jejich branži, o tom, jak eurokomisař hrozí sociálním sítím vypnutím, když nebudou včas mazat nezákonný obsah, nebo jak Meta vypustila zdarma svůj velký jazykový model.

David Slížek, vkry Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Zavřít

iRozhlas

Koubský: Vývojářům došla data z internetu, musí použít umělá. Al se poprvé dozví i o vlastní existenci

Cesta nouze

Internet není bezedný

‚Každá žena bude mít falešné nahé fotky.‘ Do výroby porna vstupuje AI, problém s dětskou nahotou zůstává

Rozvoj umělé inteligence se musí přibrzdit, možná dojde na on-line certifikáty pravosti, míní Holý

Mohlo by vás zajímat

Což takhle si dát řízek se špagetami

Týdeník iROZHLASu: od soudu s Ferim přes výhled do Unie po památník romského holokaustu

Varování před ruským imperialismem a moskevským režimem. Lipavský zkusil zapůsobit na Maďary

Téměř 134 milionů korun na účtech. Policie prošetřuje výdělky léčitele a vůdce kutnohorské sekty

Technologie

‚Klikněte mývalovi na motýlka‘. Ověření CAPTCHA, že uživatel není robot, se mění a vyžaduje víc pozornosti

Mobilní síť Vodafone měla od rána výpadky. Důvodem byly problémy s napájením datacentra

Bitevní roboti jsou sice přesní, ale usnadňují rozhodnutí zahájit válku, varuje americký etik

Nejčtenější za posledních 24 hodin

Nejčtenější za poslední 3 dny

Nejčtenější za poslední týden

Nejnovější články

ONLINE: Rusko útočilo na plynárenská zařízení, která zajišťují dodávky do Evropské unie, tvrdí Zelenskyj

Měli jsme se vás zastat, omluvili se slovenští umělci Čaputové. Ta si musela otřít slzy

Československé hrdiny připomíná výstava v Paříži. Bránili Francii před nacisty, pak uprchli do Londýna

Závěry z úvěrových smluv: sokolové budou požadovat náhradu škody po bývalé starostce a jednateli

Selhat je přirozené. Další minutu nebo den má člověk novou příležitost to udělat jinak, radí psycholog

Kdy něco trápí rostlinu? Vědci testují chytrou diagnostiku stresu, chorob a škůdců

Aktuální témata

Doporučujeme

Koubský: Vývojářům došla data z internetu, musí použít umělá. Al se poprvé dozví i o vlastní existenci

Cesta nouze

Internet není bezedný

Mohlo by vás zajímat

Což takhle si dát řízek se špagetami

Týdeník iROZHLASu: od soudu s Ferim přes výhled do Unie po památník romského holokaustu

Varování před ruským imperialismem a moskevským režimem. Lipavský zkusil zapůsobit na Maďary

Téměř 134 milionů korun na účtech. Policie prošetřuje výdělky léčitele a vůdce kutnohorské sekty

Technologie

‚Klikněte mývalovi na motýlka‘. Ověření CAPTCHA, že uživatel není robot, se mění a vyžaduje víc pozornosti

Mobilní síť Vodafone měla od rána výpadky. Důvodem byly problémy s napájením datacentra

Bitevní roboti jsou sice přesní, ale usnadňují rozhodnutí zahájit válku, varuje americký etik

Nejčtenější za posledních 24 hodin

Motiv střelce z filozofické fakulty nebyl ovlivněn duševní poruchou, potvrdila státní zástupkyně

Španělsko se snaží zachránit vychuchola pyrenejského. ‚Evolučnímu klenotu‘ hrozí vymření

Téměř 134 milionů korun na účtech. Policie prošetřuje výdělky léčitele a vůdce kutnohorské sekty

Státní zástupkyně ke střelbě na filozofické fakultě: policie nasadila atypicky dva vyšetřovatele

Ukrajina stáhla z boje americké tanky Abrams. Proti ‚dronům-zabijákům‘ nemají šanci

Polsko se vrací do elitní divize po 22 letech. V Ostravě ho poženou tisíce fanoušků

Nejnovější články

ONLINE: Rusko útočilo na plynárenská zařízení, která zajišťují dodávky do Evropské unie, tvrdí Zelenskyj

Měli jsme se vás zastat, omluvili se slovenští umělci Čaputové. Ta si musela otřít slzy

Československé hrdiny připomíná výstava v Paříži. Bránili Francii před nacisty, pak uprchli do Londýna

Závěry z úvěrových smluv: sokolové budou požadovat náhradu škody po bývalé starostce a jednateli

Selhat je přirozené. Další minutu nebo den má člověk novou příležitost to udělat jinak, radí psycholog

Kdy něco trápí rostlinu? Vědci testují chytrou diagnostiku stresu, chorob a škůdců

Aktuální témata

Doporučujeme