Konec minulega leta je kitajski DeepSeek izdal svoj veliki jezikovni model R1, ki so ga na Zahodu
opazili januarja in je zaradi domnevno bistveno cenejšega treninga za krajši čas povzročil pravo paniko. Njegov naslednik R2 bi bil moral iziti maja letos, a ga še vedno ni.
Po podatkih virov blizu DeepSeeka razlog za zamudo tiči v Huaweijevih čipih, ki so jih skušali uporabiti za trening, a so imeli z njimi nemalo težav.
Po neuradnih podatkih so se čipi Ascend izkazali za neprimerne in nezanesljive. Zaradi tehničnih težav so se na koncu odločili, da bodo uporabili Nvidiine čipe, saj so bili Huaweijevi nestabilni, prepočasni in s slabšo programsko podporo. Huawei je DeepSeeku celo poslal strokovnjake, da bi jim pomagali usposobiti čipe za razvoj modela, a na koncu je projekt padel v vodo. Za trening bodo nujni Nvdiini čipi, se pa DeepSeek trudi, da bi bilo model na Huaweijevih čipih moč vsaj poganjati.
[st.slika 75730]