Zašto kompanije za obučavanje veštačke inteligencije otkupljuju stare knjige, digitalizuju ih, a zatim uništavaju?

N.J.

Ako se ove stare knjige unište u velikim razmerama, ovo nasleđe će biti nepovratno koncentrisano u obliku mase digitalnih podataka u vlasništvu nekoliko kompanija - otkriva švajcarski javni servis RTS
(Ilustracija, Ketrin M. Vud, „Stare knjige“, ulje na platnu, 22,5 x 33 cm (8,88 x 13 inča), https://sr.wikipedia.org/sr-ec/%D0%94%D0%B0%D1%82%D0%BE%D1%82%D0%B5%D0%BA%D0%B0:Catherine_M._Wood_Old_books.jpg)

Zašto misteriozno kanadsko preduzeće za obučavanje veštačke inteligencije masovno kupuje polovne i stare knjige? Ovo pitanje postavili su sebi nemački i španski knjižari i antikvari.

Istraživanje švajcarskog javnog servisa RTS pokazalo je da kompanije koje se bave veštačkom inteligencijom otkupljuju stare knjige, digitalizuju ih, a zatim uništavaju.

“Palete starih knjiga iz knjižara širom sveta se šalju u Sjedinjene Američke Države. Veruje se da kompanije koje se bave veštačkom inteligencijom stoje iza ovog masovnog sakupljanja kulturne baštine. Navodno, koriste ove knjige kao sirove podatke za treniranje svojih jezičkih modela, a zatim ih odbacuju nakon digitalizacije”, izvestio je švajcarski RTS

Kupljene i - bačene

Od početka maja, jedna nemačka antikvarnica prima značajan broj automatizovanih porudžbina knjiga na svojoj veb stranici svake noći između 3:00 i 5:00 ujutru. Prodavac knjiga, primetivši to, konsultovao se sa kolegama. I kod njih su, iznenađujuće, počeli da se pojavljuju slični nalozi, na primer na platformi Reddit.

Prema španskim novinama elDiario i berlinskim dnevnim novinama TAZ, fenomen nije ograničen samo na Nemačku. Ove porudžbine dobijaju i kniižari u Španiji, Sjedinjenim Državama, Novom Zelandu, Australiji, Bugarskoj, Velikoj Britaniji… U svim ovim slučajevima, porudžbine šalje  ista kanadska kompanija: „Zoom Books“.

Prema izjavama iz „Zoom Books“-a za list TAZ, kompanija kupuje knjige, preprodaje ih i reciklira one koje se ne mogu prodati. Njeno distributivno tržište se prvenstveno sastoji od Sjedinjenih Država i Kanade.

„Zoom Books“ kupuje čitave palete starih knjiga: kuvare, biografije, romane. Nije reč o retkim knjigama, već naprotiv, precizira kanadski prodavac: „Ciljamo na knjige koje nisu iz oblasti književnosti, objavljene od 1970. godine pa nadalje sa ISBN brojem – prašnjave neprodate knjige koje niko nije želeo godinama.“

Sistematska kupovina, uključujući knjige na nemačkom, bugarskom ili španskom jeziku za tržište engleskog govornog područja, izazvala je ozbiljne sumnje kod nekih prodavaca. Kao odgovor na upite dnevnih novina TAZ, Rid Panel, šef razvoja u „Zoom Books“-u, nije pružio nikakve informacije o konačnim primaocima ovih knjiga.

Međutim, fotografije snimljene u centru „Zoom Books“ pokazuju knjige nemarno bačene u velike kutije; nijedan prodavac knjiga ne postupa sa svojom robom na ovaj način.

„Poštena upotreba“ autorskih dela

Ovaj fenomen masovnog sakupljanja starih knjiga mogao bi se objasniti potrebama kompanija koje se bave veštačkom inteligencijom. Obuka njihovih jezičkih modela zahteva ogromne skupove podataka. Iako takvi skupovi podataka postoje na internetu, oni su često nesortirani i neujednačenog kvaliteta – i nisu uvek slobodno dostupni.

Pre svega, objašnjava Ksavije Vinaiksa, stručnjak za veštačku inteligenciju koga je intervjuisao elDiario, „kada je slobodno dostupno znanje na internetu postalo oskudno, kompanije su požurile ka ilegalnim platformama za preuzimanje e-knjiga kako bi hranile svoje modele. Korišćenje ovih resursa dovelo je do tužbi za kršenje autorskih prava koje su iznosile milione dolara.“

Tehnološke kompanije su se tada našle u ćorsokaku, pred  „zidom podataka“, prema rečima stručnjaka. Bez novih, originalnih i dugih tekstova za obučavanje algoritma, veštačka inteligencija se našla u opasnosti od kognitivne stagnacije. Rešenje koje su ove kompanije pronašle bilo je da kupuju stare knjige.

RTS navodi da postoji “pravna rupa u Sjedinjenim Državama”. Svako ko digitalizuje tekstove i distribuira ih na internetu rizikuje krivično gonjenje zbog kršenja autorskih prava. Međutim, u Sjedinjenim Državama, zakon dozvoljava obuku modela veštačke inteligencije, koristeći legalno stečene knjige. Ako kompanija kupi velike količine polovnih knjiga po niskim cenama, rastavi ih i digitalizuje, tekst se zatim može koristiti za obuku modela veštačke inteligencije.

To je američki princip „poštene upotrebe“. On dozvoljava korišćenje autorskih dela bez izričite dozvole nosioca autorskih prava, pod uslovom da ta upotreba služi obrazovanju javnosti i stimuliše intelektualnu produkciju.

Prodaja zaliha ili prisvajanje znanja

U januaru 2026. godine, Vašington post je otkrio da je projekat masovne digitalizacije koji je vodila kompanija za veštačku inteligenciju „Anthropic“, nazvan Projekat Panama. Kompanija je koristila stotine hiljada, ili čak milione, fizičkih knjiga skeniranjem pomoću industrijskog procesa. Nakon uklanjanja poveza, stranice su digitalizovane, a zatim reciklirane, objašnjava meksički list El Imparcial.

„Princip je sledeći: morate fizički posedovati knjige i uništiti ih nakon što ih 'pročitate' – kako biste mogli da tvrdite da u opticaju nema neovlašćenih kopija i da to spada u poštenu upotrebu“, objasnio je prodavac knjiga za RTS.

„Zum Buks“ kategorično odbacuje tvrdnje o digitalizaciji ili uništavanju knjiga. Kompanija tvrdi da je to njen model reciklaže i preprodaje. Kompanije za veštačku inteligenciju, sa svoje strane, drže ove informacije u tajnosti.

Kratkoročno, prodavci knjiga su zadovoljni što mogu da prodaju svoje neprodate zalihe. Međutim, dugoročno se pojavljuje sasvim drugačiji scenario. Ako se ove stare knjige unište u velikim razmerama, ovo nasleđe će biti nepovratno koncentrisano u obliku mase digitalnih podataka u vlasništvu nekoliko kompanija. Diskretno, sistematsko prisvajanje, bez ikakve javne rasprave.

 


Molimo Vas da pročitate sledeća pravila pre komentarisanja:

Komentari koji sadrže uvrede, omalovažavanje, nepristojan govor, pretnje, rasističke ili šovinističke poruke neće biti objavljeni. Nije dozvoljeno lažno predstavljanje, ostavljanje lažnih podataka u poljima za slanje komentara. Zadržavamo pravo izbora ili skraćivanja komentara koji će biti objavljeni. Web časopis BalkanMagazin ne odgovara za sadržaj objavljenih komentara. Sva mišljenja, sugestije, kritike i drugi stavovi izneseni u komentarima su isključivo lični stavovi autora komentara i ne predstavljaju stavove redakcije Web časopisa BalkanMagazin.

captcha image
Reload Captcha Image...