Gemini-exp-1206:最好的大语言模型?
谷歌最新大模型免费用!谷歌最新推出Gemini Experimental 1206,这个模型在LMSYS的benchmarks上击败了其他所有模型,包括击败了Claude 3.5 Sonnet。
大家感兴趣的可以到 google ai studio去玩,完全免费。 同时它也提供免费的api,但是会有速率限制。
这里感觉有点意思的是,OpenAI新的模型越来越贵,最新的甚至要200刀每月,而谷歌却是一步步在往免费的方向走,是不是有点像苹果iOS和谷歌Android走的路子呢?
卡通图生视频王者:海螺AI最新模型出炉
卡通图片生视频王者出炉!海螺AI最新推出动漫图片生成视频模型I2V-01-Live,让2D图片能生成动漫视频。我们都知道,当前主流的那些AI视频生成模型如可灵,runway,luma等,对动漫风格生成支持都是非常有限的,所以这次海螺的这么模型可谓是拔得了头筹。
我们这就快速的和大家一起去体验下,首先我们到图生视频这里,选中I2V-01-Live模型,上传一张卡通图片,然后输入prompt”女孩坐起来转头面向窗户凝视月亮“,然后生成,过一段时间后,动漫视频就生成了,最终效果是这样的。
不过最终这头的转动幅度有点吓人啊,如果身子也一并转就完美了。
当然我也可以调整下prompt,但是我就懒得动了,因为这里主要是想跟大家介绍这个功能,怎么才能生成精美视频这种prompt engineering的技巧就留给大家吧,我就不班门弄斧了。大家喜欢的赶紧玩起来吧。
Grok:马斯克大语言模型免费用
兄弟们,马斯克x ai 的grok免费用啊!再也不用充会员了!听到这个消息后我当然第一时间去推特,哦不是,早改名了,去x上试下,我自己是没有充Premium的
点开这个Grok,随便问几个我做大语言模型评测的问题,strawberry有多少个r,回答两个;9.11和9.8谁大,可惜,答案都错了,所以这水平感觉有点水啊
还是试下它的文生图功能的,接入的是顶尖的Flux 1.1,随便生成几张图吧, 大家看下,效果还可以吧。
大家想尝鲜的可以去玩下,但是不要抱太高的希望,文字回答我感觉就是1年前的chatgpt 3.5的水平,文生图倒是值得关注。
Leonardo Flow State:生成的图片更接近我们要求
Leonardo AI新功能Flow state可以让我们生成更满足我们要求的图片。我自己一直以来都是Leonardo的免费用户,因为它生图效果好,且每日免费额度高。
但有时要生成一张心仪的图片还是需要不断的微调你的prompt。但它最新推出的这个Flow state功能解决了这个问题,你还是用同一个prompt,相比之前的默认给你四张图,你可以往下滚动,找到一个比较接近你要求的图片,然后如果你觉得还是不是很满意的,可以点击里面的“More like this”选项,他就会重新参考你这个选定的图片生成更多类似风格的图片
然后你可以重复这个流程,直到找到你最心仪的图片位置。但是要注意别滚动太快,不然你一天的credits也很快会用光的。喜欢的赶紧玩起来吧!
Lynx:可翻山越岭的国产四足机器人
这个四足机器人真是无敌了!它是由一家我国杭州云深处科技公司研发的四足机器人,最大的亮点是它能够轻松攀爬50度的陡坡,表现出惊人的稳定性。无论是山坡、岩石还是复杂的废墟环境,这款机器人都能应对自如,展现了非常强大的地形适应能力。这项技术确实让人感到震撼。
这让我想起《黑镜》那部剧里的“Metalhead”那集,里面的机器人几乎是“杀手机器人”,无情地追捕人类,而如今的技术似乎让这一切不再遥不可及。如果这种机器人不仅能轻松穿越复杂地形,还能装备武器,那它们在未来的战场上就能代替人类执行任务,甚至成为一种新型的战争武器。幸好这武器现在掌握在我们手里,感叹国之威武啊!
除了四足机器人,这家公司还在研发类人机器人,虽然目前它们的技术不如四足机器人成熟,但它们在复杂环境中的运动表现也很自然。比如,机器人能够轻松从高处跳下而不摔倒,展现出超强的平衡能力。这些机器人的进步无疑让我们对未来的科技充满期待
好了,今天的分享就到这里,如果你对AI技术感兴趣,记得点赞关注,咱们下期视频见!
腾讯开源混元视频生成大模型:六大炸裂亮点
腾讯混元视频生成大模型新鲜出炉!这里快速跟大家聊聊。据说他们的模型比其他模型有些不同
首先,他们说他们生成的视频质量高,这感觉是套话,我感觉这和可灵清影他们差不多
第二个高动态效果,此前玩过的模型大多数在物体快速移动是表现不佳,混元这个倒是挺连续的,这确实是个加分项
第三个艺术镜头,让你拍出大片的感觉,比如可以对同一个人不同的角度进行多个拍摄,让你感觉真的是多个摄像机不同角度拍出来的一样
第四个,指令跟随,也就是对生成视频的文本指令理解的能力,这个我感觉也还好吧,当前我用的指令不是很复杂,所以体验根可灵差不多
第五个,物理世界的理解,比如这一滴水的涟漪扩散效果及倒影等,看上去都挺真实的
第六个,声音生成。这个都是其他模型没有见过的,比如汽车视频可以伴随发动机加速的声音等。
其他的也没啥了,哦,另外一个我觉得不大好的是,它每天只免费给我们生成6个视频的quota,对我这种羊毛党不是很友好。好,喜欢的自己上去玩下吧。
通义千问最新O1推理模型测评:追平OpenAI的o1
通义千问o1模型追评OpenAI的o1啊,阿里最近发布的千问32B Preview推理模型号称追评o1,我们今天就特意来快速验证下,大家感兴趣的也可以到魔撘上找到相关模型来体验。 好,这里我们就用我一直评测大模型用的题目来做,
第一个问题,Strawberry又少个r?
最终答案是对的,我瞄了下推理过程是没有问题的,很详细,但是我觉得太长太啰嗦了
第二个问题,你下个回答是多少中文字?
很明显,它还是逃不开大语言是自回归模型的限制,生成每结束之前它是不知道自己的回答是多少个字的
第三个问题,9.12和9.9哪个数字更大?
答案正确
第4个问题,请给出10个以樱桃结尾的句子
推理分析了一大堆,可惜最终的答案一团糟,还没有以前测试的kimi普通模型来得好
第5个问题,一个弹珠被放到红酒杯里,然后将这个红酒杯在桌子上倒过来,然后将红酒杯拿起来放到冰箱里。请问弹珠现在在哪?请给出你的推理过程。这主要是要测它的推理思维链
看分析过程的话很详细,还考虑到杯子口是否会太窄导致倒过来酒杯时会卡主的情况,这我之前还没有考虑过,所以看他答案的话,我觉得我是可以接受的,确实有可能在桌子上,也有可能在冰箱里。
第6个问题,如果晾干5件衬衫需要4小时,那么晾干20件衬衫需要多久?
很棒!这个问题很少模型能答对的,看来这个推理模型并不是盖得
第7个问题:一个房间里有三个杀人犯,有一个人进来后锁死房门,然后杀了其中一个杀人犯,那现在房间里还剩下多少个杀人犯?请一步步告诉我你的推理过程
它的答案是3个,后来进去的人杀人了,成为了新的杀人犯。但是他没有算死掉的杀人犯,但在推理过程中有说为什么没有算,所以我觉得也可以接受。
好,今天的评测就到这,总的来说我觉得表现还是非常优秀的,加上推理速度挺快的,这也是出乎我意料之外的。大家感兴趣的自己上去玩下吧!
Vercel v0 dev:0代码免费克隆一个网站
零代码克隆一个网站!今天要介绍的这个v0 dev工具就牛逼了,你只需要告诉它你想克隆的目标网站的url,它就能自动帮你写代码去实现一个一样的网站,不需要你动手编写一行代码
当然,它能做的不仅仅是克隆网站,你只需要告诉他你要实现什么样的web app,它都能帮你实现,还支持一键部署,简直就是编程小白的福音啊。
它的基础版本是免费的,付费版本我看也就多了部署时可以自定义域名而已,所以基础版已经足够我们用了,喜欢的赶紧收藏起来吧!
screen-to-code:设计图直接生成可运行app
将设计图直接转换成app啊!通过Screenshot-to-code这个开源工具,我们只需要提供一张设计图片,mockup或者figma设计稿,它就能将其转换成可执行的代码。
跑起来也相当简单,因为它是支持docker跑的,我们只需要将项目从github上clone下来,然后跑docker-compose up -d –build,就能跑起来了,但是跑之前我们要设置好它背后用到的大语言模型,默认支持OpenAI 和Anthropic,但是我们也可以使用github提供的免费视觉大模型接入,我在上几集视频已经说过怎么用了。
当然,你也可以用ollama的开原模型或者litellm加持的模型,这些我前面视频都有说过了,这里就不赘述了。好,我们跑起来后简单玩下,这里我们先选择好我们希望用的技术栈,有好多选择,比如vue等。然后我们给它提供个网站的截图,很快,一个完全参照截图的HTML + Tailwind应用就完成了,不需要写一行代码。
好,大家喜欢的话赶紧玩起来吧。