谷歌推出最新Gemini 2.0免费用啊,这次Gemini总共推出了3个版本,2.0 Flash, flash-lite,以及pro版本,近期还会推出推理模型。flash模型会有100万上下文窗口,而pro则是200万,同时flash和pro据称将会在下周支持上图片生成。这些模型的performance是异常惊人的,大家可以到LM Arena竞技场上查看,前两名都是gemini的,接着是GPT-4O-latest和DeepSeek-R1,紧跟着又是Gemini的,所以说他霸榜并不为过。大家可以在谷歌的AIStudio上免费用上这些模型…
OpenAI终于免费开放搜索和推理功能
OpenAI 给免费用户开放搜索和推理功能,直接取代掉Perplexity啊!我知道搜索功能推出有段时间了,但是一直没有全部覆盖到免费用户,但今天我用我一个免费账号试了下,已经可以用上了。 而推理功能是最新的,估计是迫于DeepSeek R1的压力才推出的。这两个功能就算你不登录,只是临时聊天也是可以用上的。快速去Demo下…
DeepSeek是怎么做到的?
首先,我们看数据,V3训练用了2788K的GPU Hours,相当于一块GPU用了近300多年,而他们用了2000块GUP,所以用了越2个月时间就训练出来了。对比下LLama 3.1 405B, 它们用了近3100万个GPU Hours来训练,deepseek的11倍还多,同时还要考虑deepseek用的GPU肯定是没有人家老美的性能好的,这也就是为什么V3的训练花费比海外这些同等级别模型低几个数量级的原因,从而打破老美的算力霸权,也打破了顶尖大模型只能掌握在OpenAI和谷歌这些屯了大量卡的大公司的垄断…
OmniHuman:直接生成带声音视频
通过一张图片和音频生成全身的能说话的人物视频啊!图生视频我们看得多了,但是生成的都是没有声音的视频,后期还需要自己通过其他工具加入语音和唇形同步,字节跳动的这个OmniHuman就牛逼了,它是个多模态模型,你可以提供不同输入来生成视频,比如提供图片加音频加肢体动作信息来生成和真实视频无异的视频…
HuggingFace:50万个免费AI工具任你用
50万个免费AI工具任你用啊!大家知道我每天都会分享一个免费AI工具的使用经验,这些工具其中一个很重要的来源就是Hugging Face的space,比如以前分享过的Stable Diffusion 等。要使用这些免费AI工具,我们呢来到huggingface…
DeepSeek R1 是怎么训练出来的?
这几天发了不少DeepSeek的视频,看到有不少同学对V3和R1的关系不是很清楚,这里简单说下我自己的理解。首先,我们要知道大语言模型的训练最开始是用各种网络数据训练出能对语言有基本理解的模型,这通常叫做预训练过程,得出来的模型通常叫做Base Model,比如这里的DeepSeek-v3就是个base model,这个base model就像一个打破任督二脉的武林高手,一身知识和内功,但是不懂怎么运用…
Surf.new:AI自动控制浏览器完成任务.
控制浏览器完成任务的免费AI Agent啊!今天淘到的这个叫做surf.new的Agent就牛逼了,我么可以给他下一个指令,然后它就能自动帮我们细化这个指令,然后一步步操作浏览器来完成我们的任务…
Mistral Small 3:全面评测评报告!
Mistral推出免费商业可用的Small 3,估计是受到了DeepSeek效应影响,它的license从原来的mistral变成apache2,也就是商业可用。它有24B的参数,性能却媲美llama3.3 70B,将会是GPT4O-mini绝佳的替代方案,这样的参数量,在本地用个RTX 4090就能跑起来。我们今天循例用我们这套测试用例来测评下…
OpenAI Deep Research:专业人员的饭碗要被砸了
OpenAI推出Deep Research,它只需要4,5分钟就能做出一个我们专业人员需要一整天才能完成的专业报告,它会综合数百个在线资源来得出研究分析师级别的报告,且用到的是O3模型,这应该是目前唯一能用到完整的O3模型的地方…
O3-mini vs DeepSeek r1 对比评测
OpenAI免费O3-mini效果惊人啊!上两天我分享了个视频说OpenAI迫于DeepSeek R1的压力推出了免费的O3-Mini来硬扛,今天我们就循例用这套测试用例快速的测试下。我们来到官网,我当前这个是免费账号,这里我们可以看到我们用的是O3-mini,要用上这个记得这里选上推理…