catrw catrw
257
BLOG

Chińska sztuczna inteligencja szokuje rynek

catrw catrw Technologie Obserwuj notkę 24

Chińska sztuczna inteligencja szokuje rynek

Rynki są tak wystraszone, że około biliona USD wartości rynkowej wyparowało z powodu wydania jednego bitu oprogramowania...

Najlepiej pokazują to wykresy z Wall Street .

image


image


https://www.cbsnews.com/news/what-is-deepseek-ai-china-stock-nvidia-nvda-asml/


Co się wydarzyło?

Chińska firma zajmująca się sztuczną inteligencją o nazwie DeepSeek przyciąga uwagę Ameryki – i wysyła falę uderzeniową przez Wall Street – ze względu na swoją nową technologię, która według niektórych ekspertów rywalizuje z ChatGPT firmy OpenAI.

DeepSeek to prywatna chińska firma założona w lipcu 2023 roku przez Liang Wenfenga, absolwenta Uniwersytetu Zhejiang, jednego z najlepszych chińskich uniwersytetów, który sfinansował startup za pośrednictwem swojego funduszu hedgingowego, według MIT Technology Review. Liang ma aktywa o wartości około 8 miliardów dolarów, napisał Ives w notatce badawczej z 27 stycznia.

DeepSeek zaskakuje również inwestorów ze względu na niskie koszty rozwoju swojej aplikacji AI, które analityk Wedbush Securities, Dan Ives, ustalił na zaledwie 6 milionów dolarów. Dla porównania, według Goldman Sachs OpenAI, Google i inne duże amerykańskie firmy są na dobrej drodze do zainwestowania łącznie około 1 biliona dolarów w sztuczną inteligencję w nadchodzących latach.

W poniedziałek wprowadzenie DeepSeek zachwiało akcjami takich firm jak Nvidia, producent zaawansowanych chipów zaprojektowanych z myślą o rozwoju sztucznej inteligencji, oraz holenderska firma ASML, inny producent chipów. Technologia chińskiej firmy rodzi pytania o to, czy popyt na chipy Nvidii może ucierpieć, a także czy inwestorzy nie przeceniają akcji spółek technologicznych, które zostały podbudowane obietnicą sztucznej inteligencji, od Meta po Microsoft, twierdzą eksperci.

"DeepSeek szturmem podbił rynek, robiąc więcej za mniej" – powiedział Giuseppe Sette, prezes firmy Reflexivity, zajmującej się badaniami rynku sztucznej inteligencji, w e-mailu. "To pokazuje, że w przypadku sztucznej inteligencji niespodzianki będą się pojawiać w ciągu najbliższych kilku lat".

DeepSeek AI jest darmowa, a porównywalna wersja ChatGPT kosztuje 200 USD miesięcznie...

DeepSeek, model R1 przewyższa OpenAI o1 w wielu kluczowych testach, świecąc szczególnie jasno w matematyce, gdzie bije na głowę najnowszy model firmy Sama Altmana w trzech różnych testach. Chociaż jest mniej spójny w testach kodowania i językowych - wypadł szczególnie źle w "SimpleQA", teście oceniającym prostą dokładność faktograficzną informacji, które wypluwają LLM - różnice są dość niewielkie, dzięki czemu ekonomiczny R1 wygląda imponująco.

Odchudzone koszty szkoleń chińskiej firmy, korzystanie z tańszych chipów, API i modelu open source sprawiły, że niekończące się dążenie do większej liczby chipów i mocy obliczeniowej, które w ciągu ostatnich 18 miesięcy postawiło pod znakiem zapytania znaczną część rynku.

Ponieważ wymaga mniejszej mocy obliczeniowej, koszt uruchomienia DeepSeek-R1 stanowi dziesiątą część kosztów podobnych konkurentów, mówi Hanchang Cao, przyszły adiunkt w dziedzinie systemów informatycznych i zarządzania operacyjnego na Uniwersytecie Emory. "Dla badaczy akademickich i start-upów ta różnica w kosztach naprawdę wiele znaczy", mówi Cao.

DeepSeek osiągnął swoją skuteczność na kilka sposobów, mówi Anil Ananthaswamy, autor książki Why Machines Learn: The Elegant Math Behind Modern AI. Model ma 670 miliardów parametrów, czyli zmiennych, na podstawie których uczy się podczas trenowania, co czyni go największym jak dotąd dużym modelem językowym typu open source, wyjaśnia Ananthaswamy. Jednak model wykorzystuje architekturę zwaną "mieszanką ekspertów", dzięki czemu tylko odpowiednia część tych parametrów — dziesiątki miliardów zamiast setek miliardów — jest aktywowana dla danego zapytania. Obniża to koszty obliczeniowe. DeepSeek LLM wykorzystuje również metodę zwaną wielogłowicową utajoną uwagą, aby zwiększyć wydajność swoich wniosków; I zamiast przewidywać odpowiedź słowo po słowie, generuje wiele słów jednocześnie.

Innym ważnym aspektem DeepSeek-R1 jest to, że firma udostępniła kod źródłowy stojący za produktem, mówi Ananthaswamy. (Dane treningowe pozostają zastrzeżone). Oznacza to, że roszczenia firmy mogą zostać sprawdzone. Jeśli model będzie tak wydajny obliczeniowo, jak twierdzi DeepSeek, prawdopodobnie otworzy to nowe możliwości dla badaczy, którzy wykorzystują sztuczną inteligencję w swojej pracy, aby robić to szybciej i taniej. Umożliwi to również więcej badań nad wewnętrznym funkcjonowaniem samych LLM.

"Jedną z wielkich rzeczy była przepaść, która otworzyła się między środowiskiem akademickim a przemysłem, ponieważ środowisko akademickie nie było w stanie pracować z tymi naprawdę dużymi modelami ani prowadzić badań w żaden znaczący sposób", mówi Ananthaswamy. "Ale coś takiego jak to, jest teraz w zasięgu środowiska akademickiego, ponieważ masz kod".


Rozwój DeepSeek kosztował podobno 5,6 miliona dolarów w porównaniu z kosztami amerykańskimi szacowanymi na około 1 miliard dolarów.


Model DeepSeek podobno wymagał zaledwie 2 000 chipów Nvdia (niektóre szacunki mówią o 10 000 chipów) do opracowania, w porównaniu z oczekiwaniami Meta, że do końca tego roku będzie potrzebować 1,3 miliona zaawansowanych chipów.


Nie wątpię w liczby DeepSeek, ponieważ dostęp do zaawansowanych chipów Nvidii odbywał się za pośrednictwem wynajętych centrów danych z ograniczonym dostępem, którego Chiny w ogóle nie powinny mieć.


Nie wiemy, ile Chiny naprawdę wydały, ale na pewno wiemy, że sankcje eksportowe Bidena na technologię poniosły spektakularną porażkę.


Jeden z najlepszych na świecie ekspertów od AI pracujący w Mossadzie uważa, że jest spore prawdopodobieństwo, że może to być operacja psychologiczna?




....


catrw
O mnie catrw

Nowości od blogera

Komentarze

Pokaż komentarze (24)

Inne tematy w dziale Technologie