»

Muskov xAI predstavil model Grok 3

Slo-Tech - Muskovo podjetje za razvoj umetne inteligence xAI je predstavilo novo generacijo modela Grok. Tretja inkarnacija obstoji tudi v različicah Mini in Reasoning. Prva ima manjši nabor parametrov, s čimer je hitrejša in manj požrešna, druga pa reševanju nalog. Ob tem je xAI dejal, da je družina Grok 3 zmogljivejša od konkurence.

Grok 3 so predstavili v prenosu v živo na platformi X, kar je bil mestoma precej nenavaden dogodek. Poleg razvijalcev je sedel njihov šef Elon Musk, ki jih je vmes dopolnjeval in popravljal. Med drugim je dejal, da na modelu neprestano delajo in da se bo sproti izboljševal. To v praksi ni možno, saj je model po treningu zaklenjen, možne so le manjše spremembe (fine-tuning).

Kdaj bo Grok 3 na voljo za končne uporabnike, niso povedali. Dejali pa so, da so ga izurili z desetkrat več računske moči od predhodnika. Musk je v svojem slogu dodal, da gre ultimativni model, ki išče resnico, ki je včasih v nasprotju s politično korektnostjo.

V testih matematike (AIME)...

42 komentarjev

Južna Koreja umaknila aplikacijo DeepSeek

Slo-Tech - V Južni Koreji je informacijski pooblaščenec odločil, da morajo zaustaviti prenašanje aplikacije za kitajsko umetno inteligenco DeepSeek. Omejitev velja le za nove prenose, torej so aplikacijo odstranili s spletnih tržnic, obstoječi uporabniki pa lahko nadaljujejo uporabo. Proizvajalec je priznal, da morda niso spoštovali vseh pravil, ki jih zapoveduje južnokorejska zakonodaja o varovanju zasebnosti.

V Južni Koreji je zasebnost izjemno strogo varovana. DeepSeek ne opredeljuje ustrezno podrobnosti o posredovanju podatkov tretjim strankam in zbiranju osebnih informacij. Dokler teh podrobnosti ne razčistijo, bo aplikacija v državi ostala zamrznjena. Kitajci so v Južno Korejo že poslali predstavnike podjetja, ki bodo skušali zgladiti spor.

Na Zahodu DeepSeek ostaja dostopen, dasiravno je skepse veliko, varnostne službe pa so tudi zaskrbljene. DeepSeek je na primer prepovedan na službenih napravah državnih uradnikov v Avstraliji, Južni Koreji in Tajvanu. V Italiji je DeepSeek začasno...

12 komentarjev

Kaj nam bodo dragi modeli, če imamo poceni?

Slo-Tech - DeepSeek je razburkal svet z najavo, da so svoj model DeepSeek R1 izurili za vsega šest milijonov dolarjev, a gre še ceneje. Raziskovalci s Stanforda in washingtonske univerze so pripravili model s1, ki je primerljiv z OpenAI o1 in DeepSeek R1, le da so za njegovo pripravo porabili 50 dolarjev, kodo in vhodne podatke trening pa priobčili javnosti.

Ocena 50 dolarjev ni povsem poštena, saj so porabili toliko denarja za najem računske moči za trening. V to torej niso všteti niti stroški nabave strojne opreme niti stroški dela ljudi. Druga pomembna podrobnost je način učenja, saj je s1 uporablja distilacijo, torej se je učil na modelu Gemini 2.0 Flash Thinking Experimental. Na podoben način so na Berkeleyju že januarja pripravili model za 450 dolarjev.

Kodo za s1 in vse spremljajoče informacije so objavili na Githubu. To pomeni, da ga lahko uporabi ali nadalje razvija vsakdo. Ključno vprašanje pa je, kaj to pomeni za razvoj novih modelov od začetka. Razvoj s1 je bil tako poceni, kar...

20 komentarjev

OpenAI odgovoril z o3-mini

Slo-Tech - Iztekajoči teden sta močno zaznamovala kitajska modela umetne inteligence DeepSeek in Alibaba Qwen, ki obljubljata primerljive rezultate z zahodnimi modeli ob nekajkrat nižjih stroških. To je preplašilo zlasti trge in proizvajalce čipov, medtem ko se proizvajalci programske opreme novih modelov lahko le razveselijo, saj bodo z manj stroški lahko postorili več. OpenAI je hitro odgovoril in je javnosti odprl model o3-mini, ki je na voljo brezplačno in brez registracije, torej za slehernika.

OpenAI je o3-mini napovedoval in demonstriral že minuli mesec, sedaj pa ga je dal v uporabo. Podobno kot o1-mini je tudi naslednik prilagojen za uporabo v naravoslovno-tehničnih kontekstih, matematiki, računalništvu in programiranju, torej razširjenem STEM. Na voljo so trije podmodeli (reasoning effort option), in sicer nizki, srednji in visoki. Najzmogljivejši presega tudi o1, vsi pa so varčnejši. OpenAI zagotavlja tudi, da o3-mini naredi tretjino manj resnih napak kot o1-mini in se hitreje...

16 komentarjev

DeepSeek je na internetu pozabil javno dostopno bazo svojih podatkov

Slo-Tech - DeepSeek je morda res zatresel svet, a pri tem so bili površni in nepazljivi. Na internetu se je znašla baza podatkov, v kateri so tudi vsebine pogovorov, ki so jih imeli z DeepSeekom različni uporabniki. Gre za bazo Clickhouse, ki ima več milijonov vrstic dnevnika pogovorov. Poleg tega je v njej moč najti tudi ključe, podrobnosti delovanja in druge občutljive informacije.

Ranljivost je že zakrpana, saj so jo v podjetju Wiz Research po odkritju takoj odgovorno prijavili DeepSeeku, ki je hitro ukrepal. Baza je bila dostopna na naslovih oauth2callback.deepseek.com:9000 in dev.deepseek.com:9000, uporabljala pa ni niti najosnovnejših zaščit. Brez kakršnekoli avtentikacije je bilo možno izvajati operacije nad bazo. Odkrili so jo med rutinskim pregledovanjem, katere domene ima DeepSeek javno dostopne, in to ne le prek vrat 80 ali 443. Nekaj domen so tako našli, ki so odgovarjale na vratih 8123 in 9000.

Ami Luttwak iz Wiz Research dodaja, da se napake seveda dogajajo, a je šlo v tem...

43 komentarjev

Po DeepSeeku tudi Alibaba

Slo-Tech - Danes je svoj veliki model predstavila tudi Alibaba. Qwen2.5-Max, ki je bil natreniran na 20.000 milijardah drobcev informacij (token), je po meritvah ustvarjalcev celo malo boljši od Deepseeka V3, GPT-4o, Llame-3.1 in primerljiv s Claude-3.5-Sonnetom.

Novi model lahko preizkusimo kot klepetalnik, naročniki pa imajo tudi dostop do API prek Alibaba Cloud. Prve verzije Qwen2.5 smo sicer videli že jeseni. Qwen2.5-Max lahko sprejme do 100.000 vhodnih znakov, njegovi odgovori pa so tudi v slovenščini. Qwen2.5 zna odgovarjati na vprašanja, brskati po spletu, ustvarjati slike in videoposnetke.

Alibaba model označuje kot vizualnega agenta, s čimer namiguje na multimodalnost. Osnovan je na verziji Qwen2-VL iz septembra 2024, na voljo pa je v verzijah s 3, 7 in 72 milijardami parametrov. Na voljo je tudi na Githubu.

35 komentarjev

OpenAI 12. dan pokazal še novi model o3

Slo-Tech - OpenAI je včeraj sklenil 12-dnevno predstavljanje novosti, ko so vsak dan napovedali ali pokazali nekaj novega. Skrajšani adventni koledar so zaključili z napovedjo novih modelov o3 in o3-mini. Gre za nadgradnjo modelov o1, a so oznako o2 izpustili zaradi istoimenskega britanskega operaterja.

Model o3 je testu ARC-AGI dosegel rezultat 87,5, s čimer se kosa z ljudmi, ki v povprečju zmorejo okrog 85 točk. Tudi na drugih modelih, denimo American Invitational Mathematics Exam, GPQA Diamond ali Frontier Math je dosegel rekordne rezultate. Manjši model o3-mini naj bi bil še vedno sposobnejši od večje verzije predhodnika o1.

Druge novosti so integracija v programska orodja in pisarniške pakete, dostop prek telefona (1-800-CHATGPT), dostop do o1 prek API, iskanje prek ChatGPT, dodatne glasovne funkcionalnosti in Božičkov glas, Canvas, Apple Intelligence, model za videoposnetke Sora itd. Prvi dan so začeli z o1, ki ga je včeraj nadgradil o3.

14 komentarjev

Najnovejši ChatGPT stane 200 dolarjev na mesec

Slo-Tech - OpenAI je predstavil nov naročniški paket ChatGPT Pro, ki stane osupljivih 200 dolarjev na mesec. Gre za najzmogljivejši paket, ki vključuje neomejeno uporabo vseh orodij iz družine ChatGPT (o1, o1 mini, GPT-4o in advanced voice), torej tudi najnovejši model o1. Ta je še zmogljivejši od dosedanje verzije o1-preview, je dejal Sam Altman. Ob tem je želel pomiriti strasti s pojasnilom, da bo velika večina ljudi povsem zadovoljna z desetkrat cenejšim paketom, ki zmore enake stvari, a nekoliko manj obilno. Edina izjema je novi model o1pro. Prav tako nudijo dva tedna preizkusa, v tem času pa lahko nezadovoljni uporabniki kupnino dobijo povrnjeno.

Ključna razlika je v računski moči, ki je na voljo uporabnikom posameznih paketov. Z najdražjim omejitev ne bo, a še vedno veljajo pogoji uporabe. Ti na primer prepovedujejo deljenje gesel med več uporabniki. Cenejšim variantam ostajajo nespremenjene cene, prav tako še vedno ostaja na voljo tudi brezplačna inačica za občasne in nezahtevne...

27 komentarjev

OpenAI predstavil novi model O1

Slo-Tech - OpenAI je v četrtek predstavil nov generativni model O1, ki je trenutno na voljo v izvedenkah o1-mini in o1-preview. Ključna razlika v primerjavi s predhodnikom GPT-4o je bolj celostno razmišljanje, saj je model namenoma narejen tako, da se odziva nekoliko počasneje in da premisli o celotnem vprašanju, preden izpljune odgovor. To so dosegil tako, da so ga učili na povsem novem podatkovnem nizu, hkrati pa so uporabili nove algoritme. Za zdaj še nima večmodalnosti, zato ne more analizirati fotografij ali slikati.

Hkrati je tudi precej dražji, zato bo uporaba prek API od tri do štirikrat dražja, uporabniki plačljive spletne inačice pa bodo dobili le omejeno število poizvedb na teden. OpenAI O1 v resnici še ni povsem končan, zato ga označujejo kot preview. A kljub temu je pri vprašanjih, ki terjajo celostni premislek, denimo pri reševanju matematičnih zagonetk, presenetljivo natančen. Ker pa nima dostopa do interneta in ima drugačno vrsto znanja, je manj natančen pri odgovarjanju na...

25 komentarjev

GPT-4o mini nadomešča GPT-3.5 Turbo

Slo-Tech - OpenAI je danes predstavil GPT-4o mini, ki je manjši brat že znanega GPT-4o. Na voljo bo tudi za uporabnike brezplačnih računov, saj bo nadomeščal GPT-3.5 Turbo. Za zdaj ni nobenih informacij, da bi bila uporaba omejena, tako kot to velja za GPT-4o, kjer imajo brezplačni uporabniki na voljo le nekaj odgovorov vsakih nekaj ur.

Za uporabnike, ki imajo plačljivi strojni dostop, je bistveno cenejši od prejšnjih verzij. OpenAI pojasnjuje, da stane 15 centov za milijonov vhodnih znakov in 60 centov za milijon izhodnih znakov, kar je približno desetkrat ceneje od najzmogljivejših modelov prejšnje generacije in 60 odstotkov ceneje od GPT-3.5 Turbo. GPT-4o mini zna marsikaj, predvsem pa je večmodalen, torej razume tako besedila kakor tudi slike in podobno. Trenutno razume besedilo in vid prek API, v prihodnosti pa bo še slike, video in zvok.

OpenAI pojasnjuje še, da je tudi v novem modelu onemogočeno škodljivo delovanje, denimo ustvarjanje sovražnega govora ali spama, pa tudi...

2 komentarja