DeepSeek: novo modelo de IA chinesa supera ChatGPT nos EUA e derruba ações de empresas

corpoVirtual@lemmy.eco.br · 4 days ago

DeepSeek: novo modelo de IA chinesa supera ChatGPT nos EUA e derruba ações de empresas

vitrola06@lemmy.eco.br · 4 days ago

Deixando de lado toda essa baboseira de bolsa de valores, o que vocês que utilizaram o DeepSeek acharam dos modelos? Vocês pretendem utilizá-los no lugar das alternativas?

tea_pot_tinhas@lemmy.eco.br · 3 days ago

Eu cheguei a testar rapidinho o modelo básico de 8GB, e me pareceu interessante… Fiquei curioso sobre os maiores. Pra mim até agora é basicamente uma curiosidade, mas se der pra rodar localmente um chatgpt “bom”, eu consideraria seriamente um upgrade na máquina.

corpoVirtual@lemmy.eco.br · edit-2 3 days ago

Eu não saberia compara-lo com os outros por que não usei seus modelos de IA, só um pouquinho o da OpenAI por curiosidade. O que me interessou de testar esse da china foi pelo fato dele ser open-source o tornando auditável pra qualquer vigarice. (e ainda assim criei uma conta com um email novo).

Pelo pouco que usei dele achei bom, ele demora as vezes pra responder mas as respostas são boas na minha opinião de leigo, usei ele pra me ajudar a achar um software que fixasse uma imagem na área de trabalho(meu cronograma de estudos kkkkk) e perguntei umas coisas pra ele sobre obsidian, produtividade, linux e organização, pretendo continuar usando ele.

Não fiz testes pra ver se ele inventa algo ou se da respostas erradas mas creio que nos dias que virão muitas pessoas farão esses testes.

OBS: Testei a versão do site deles apenas.

abobla@lemm.ee · 4 days ago

Mas por que as ações da NVIDIA cairiam com o lançamento desse novo modelo de I.A? Ela não é responsável por vender o principal hardware que roda a inteligência artificial? Não entendi essa queda.

nossaquesapao@lemmy.eco.br · 4 days ago

Mudanças bruscas nas cotação das bolsas são muito mais movidas por sentimentos do que por qualquer lógica, e isso foi divulgado pela mídia como uma vitória tecnológica contra os eua, então isso refletiu em toda a bolsa deles, pelo menos nas empresas logadas à tecnologia, mesmo que por lógica ainda haja uma dependência chinesa das placas de vídeo deles.

Paula_Tejando@lemmy.eco.br · 4 days ago

Boa pergunta. Pode não ser relacionado. A AMD tava lançando o ROCm como open source, se não me engano.

vitrola06@lemmy.eco.br · 4 days ago

Dizem que ele foi treinado em mais ou menos 6 milhões de dólares de hardware e que isso seria uma fração do utilizado pelas empresas ocidentais. Dessa forma, a demanda pelas GPUs da Nvidia cairia bastante se esse método de treinamento fosse adotado por toda a indústria.

abobla@lemm.ee · 3 days ago

mas se o custo do hardware cai, isso não permite que empresas menores entrem no jogo? É como se, ao invés de termos 10 empresas comprando 2000 chips, nós agora temos 1000 empresas comprando 20 chips.

Ou pelo menos é isso que eu acho que aconteceria.

vitrola06@lemmy.eco.br · 3 days ago

Faz sentido, mas aí entra na lógica do comentário do @nossaquesapao@lemmy.eco.br?

abobla@lemm.ee · 3 days ago

acho que sim, não sei como o mercado funciona kk

vitrola06@lemmy.eco.br · 3 hours ago

Descobri uma coisa interessante: o DeepSeek foi treinado sem o CUDA, que é o sistema proprietário da Nvidia utilizado por todo o resto da indústria. Isso significa que, com esses avanços, pode-se usar qualquer GPU para obter resultados satisfatórios, não só as da Nvidia.

I Cast Fist@programming.dev · 3 days ago

Ela não vai vender a mesma quantidade de chips e, mesmo que vendesse, seriam vendidos os mais baratos. Hoje, suponho que as empresas de IA estão tendo que comprar o equivalente a caminhões da RTX4090, que é cara pra caralho. Com esse deepseek, as empresas conseguiriam se virar com a RTX4060, que é metade do preço.