cross-posted from: https://lemmy.eco.br/post/10498555
A queda das ações de empresas vinculadas a IAs, como a Nvidia e a Oracle, nesta segunda-feira (27) se deve a ascensão do assistente de inteligência artificial DeepSeek – de uma startup chinesa – que recentemente ultrapassou o seu concorrente, ChatGPT, em número de downloads na App Store, além de ter se tornado o aplicativo gratuito com a melhor avaliação na loja Apple americana.
Deixando de lado toda essa baboseira de bolsa de valores, o que vocês que utilizaram o DeepSeek acharam dos modelos? Vocês pretendem utilizá-los no lugar das alternativas?
Eu cheguei a testar rapidinho o modelo básico de 8GB, e me pareceu interessante… Fiquei curioso sobre os maiores. Pra mim até agora é basicamente uma curiosidade, mas se der pra rodar localmente um chatgpt “bom”, eu consideraria seriamente um upgrade na máquina.
Eu não saberia compara-lo com os outros por que não usei seus modelos de IA, só um pouquinho o da OpenAI por curiosidade. O que me interessou de testar esse da china foi pelo fato dele ser open-source o tornando auditável pra qualquer vigarice. (e ainda assim criei uma conta com um email novo).
Pelo pouco que usei dele achei bom, ele demora as vezes pra responder mas as respostas são boas na minha opinião de leigo, usei ele pra me ajudar a achar um software que fixasse uma imagem na área de trabalho(meu cronograma de estudos kkkkk) e perguntei umas coisas pra ele sobre obsidian, produtividade, linux e organização, pretendo continuar usando ele.
Não fiz testes pra ver se ele inventa algo ou se da respostas erradas mas creio que nos dias que virão muitas pessoas farão esses testes.
OBS: Testei a versão do site deles apenas.
Mas por que as ações da NVIDIA cairiam com o lançamento desse novo modelo de I.A? Ela não é responsável por vender o principal hardware que roda a inteligência artificial? Não entendi essa queda.
Mudanças bruscas nas cotação das bolsas são muito mais movidas por sentimentos do que por qualquer lógica, e isso foi divulgado pela mídia como uma vitória tecnológica contra os eua, então isso refletiu em toda a bolsa deles, pelo menos nas empresas logadas à tecnologia, mesmo que por lógica ainda haja uma dependência chinesa das placas de vídeo deles.
Boa pergunta. Pode não ser relacionado. A AMD tava lançando o ROCm como open source, se não me engano.
Dizem que ele foi treinado em mais ou menos 6 milhões de dólares de hardware e que isso seria uma fração do utilizado pelas empresas ocidentais. Dessa forma, a demanda pelas GPUs da Nvidia cairia bastante se esse método de treinamento fosse adotado por toda a indústria.
mas se o custo do hardware cai, isso não permite que empresas menores entrem no jogo? É como se, ao invés de termos 10 empresas comprando 2000 chips, nós agora temos 1000 empresas comprando 20 chips.
Ou pelo menos é isso que eu acho que aconteceria.
Faz sentido, mas aí entra na lógica do comentário do @nossaquesapao@lemmy.eco.br?
acho que sim, não sei como o mercado funciona kk
Descobri uma coisa interessante: o DeepSeek foi treinado sem o CUDA, que é o sistema proprietário da Nvidia utilizado por todo o resto da indústria. Isso significa que, com esses avanços, pode-se usar qualquer GPU para obter resultados satisfatórios, não só as da Nvidia.
Ela não vai vender a mesma quantidade de chips e, mesmo que vendesse, seriam vendidos os mais baratos. Hoje, suponho que as empresas de IA estão tendo que comprar o equivalente a caminhões da RTX4090, que é cara pra caralho. Com esse deepseek, as empresas conseguiriam se virar com a RTX4060, que é metade do preço.