模型、产品、实践三维度看AI(产品模型实验)
haoteby 2025-03-23 19:42 24 浏览
在人工智能蓬勃发展的当下,AI技术的复杂性与多样性让许多从业者和研究者感到既兴奋又困惑。为了更好地理解AI的全貌,本文将从模型、产品和实践三个维度展开深入探讨,供大家参考。
今年是个热闹的AI年,年初的deepseekR1平地一声雷,又一次掀起了全民的热潮,做为一个AI行业的从业者,见证了23年AI的惊起到沉浸,再到24年的蓬勃发展,我想每个月进录一下在AI行业中发生的那些有趣的事情,就有了这份月报。
AI发展中最重要的一个事情莫过于模型能力&算力成本。
模型能力决定了AI到底有多强,是洲际导弹还是弓箭;而算力成本决定了AI到底是个高大上的科研产品,还是普通人都可以日常使用的工具;AI月报的第一部分我们就来重点关注这个事情。
第二部分是有趣的AI产品,会带着大家看看实用有趣的AI产品。
第三部分是落地实践案例,我们去看看AI在日常生活中有哪些非常棒的使用方法。
一、模型能力 & 算力成本
1.1 闭源模型
2月份新发布的模型:
- OpenAI的ChatGPT4.5(看不懂升级了点啥)
- 马斯克的Grok3(榜单第一)
- Anthropic的Claude3.7(极强编程能力)
- 谷歌的Gemini2.0系列(Flash、pro、Flash Thinking 百万上下文)
模型排行榜参考Chatbot Arena LLM Leaderboard,它是业界公认的最公正、最权威榜单之一,也是全球顶级大模型的最重要竞技场。
它们的模型成本对比如图所示:
从成本上来看,OpenAI的4.5真是离谱到家的产品,价格比最贵的Claude贵10倍以上了;谷歌的Gemini模型继续保持了量大便宜的惯例,Gemini和DeepSeek一样都支持缓存命中,相同内容的token成本还能再降低1/10。
以下是新模型发布值得关注的点:
1)Claude 3.7:编程能力强到爆炸。
在单独的模型编程榜中,Claude3.7无疑是遥遥领先了,其它模型跟它的差距变得更大了。
从代码长度测试下来,600行的代码它可以轻轻松松写下来,1700行都能够搞定;之前Claude3.5也就300行轻松,再多一点各种bug频出了。
一句话写个网页案例:
2)Grok3
是其它家没有的功能;模型能力也非常强,且没啥太多的忌讳。
3)Gemini2.0
超强的上下文能力,支持100万token,保持了Gemini家族的惯性。
4)ChatGPT的4.5升级了
实在不知道它升级了点啥,目前只能200美刀一个月的会员才能用;从模型能力和测评上来看这个模型好像新版本强的有限。
来源:Twitter karminski-牙医
经典的草莓问题还是数不对,其它能力也看起来变化不大,具体的在等大家测试下来看看。
来源:Twitter Alex Northstar
1.2 开源模型
开源模型上通义发布了3个开源模型,他们分别是:
1)多模态识别模型
Qwen2.5-VL,有 3B、7B 和 72B 三个尺寸版本。
72B是比GPT4o和Claude3.5更强的视觉模型,能够最多支持1个小时的视频理解。
不错的多模态识别能力
2)超长文本处理模型
Qwen2.5-1M,专门处理长文本的AI模型;分为7B和14B两个模型。在100万token的大海捞针中,有不错的表现
3)文生视频模型:Wan2.1
有1.3B和14B两个版本。视频评测VBench中踩下Sora、Pika等国际对手(总分86.22%第一)。
comfyUI也接入这个模型,效果看起来还是很不错的
二、有趣的AI产品
1. ima知识库
腾讯出品的一款基于deepseekR1的PC端知识库产品,用来阅读文章非常省事。
支持网站浏览器和传文章等多种阅读方式,还可以搜索公众号的内容,记得用的时候选R1模型。
用R1读文章,让它运用深度思考的能力同时说人话,可以快速抓到一个文章的重点,然后自己根据需求再去判断要不要继续读文章。
2. AI编程产品
Cursor 3.7出来了,做产品更方便了,这两款AI产品都适合用AI来写代码。
Cursor:最新版以Agent模式为核心,对小白来说用AI编程门槛又低了一些,之前的环境问题都可以让AI干活来搞定了;同时也支持Claude3.7,编程能力杠杠的。
字节的Tera:一款新上的AI编程工具,交互页面更舒服一点,目前还是免费状态;支持3.5和3.7。
3. 用R1的一些渠道
官网总是出现R1不干活的情况,2月份也有不少平替出来,各家云厂商也都支持了R1的调用,大家可以按需进行选择;但需要注意云厂商的R1是没有虚拟缓存的,对于批量打api的成本需要重新算成本。
云的话:硅基云、阿里云、火山云都可以,根据大家的需求选择;官网也恢复充值了,但是看起来还是不稳定,没有1月份并发快。
本地化+API调用建议选择chatbox+硅基流动,用起来体验还不错
4. 秘塔搜索研究模式
把搜索变成了两种不同的研究模式,用于提升搜索的准确性,用起来体验还不错
我在做API价格对比的时候搜了一下,抛掉Gemini2没找到信息源,整理的没啥问题
5. 可灵1.6的毛绒玩具
把任何东西变成毛绒玩具,是个蛮好玩的特效功能;我试了试把灭霸转化一下,看起来还不错,而且生成的时候可灵还会给你加个好玩的配音。
三、落地实践案例
1. 简单方便用好R1的一个小技巧:加一句说人话。
就可以让R1输出的内容更加接地气,而不是高大上的一堆堆词。
2. Claude 3.7的画图,以下是一些案例参考
3. 飞书多维表格+R1
是个很便捷不需要开发就可以使用AI能力的文档,下面是一些给大家找的参考案例
先介绍一下这个功能:飞书文档在最近的多维表格里接入了R1模型,可以直接通过表格来调取火山云的API来实现AI功能,不需要编程只需要调一下文档就可以了
Cynthia’s做的AI文献速度神器:
https://jih7kdah80b.feishu.cn/wiki/BpSIwQSyritC1eko1OKcIvDknKb?table=tblK1CVZBHe1zBY9&view=vewekYXv2s
木水酱的AI胃之书:为了好好吃饭,我用飞书多维表格+DeepSeek做了个定制版胃之书
4. AI陪伴的总结文章:10 个月,5 万 DAU,我们可能找到了 AI 陪伴的另一种可能
AI创业中一直难绕过去的一个问题是token消耗,这和传统互联网时的边际成本递减完全反过来了,用户用的越多消耗越多,特别是聊天类的产品形态,还得把上下文包含进来要么角色就傻了,这个成本增加的更厉害,AI陪伴产品也就很难盈利。
从王登科做的独响,可以看到他们对社交本身的深刻认知,然后打造了这样一款有意思的AI陪伴产品,能够产品有良性的增长和盈利;对业务深度的洞察是做好一个产品的永恒的前提。
本文由人人都是产品经理作者【云舒】,微信公众号:【云舒的AI观察笔记】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
相关推荐
- 法网公开赛再遭雨水突袭“三无赛事”困局一年后破解
-
大雨突降,比赛被迫取消。广州日报全媒体记者孙嘉晖摄今天,法网公开赛进入正赛第11个比赛日,突如其来的大雨让本该在当地时间14时开球的女单1/4决赛被迫延迟,最终组委会官方确认,当天比赛因恶劣天气全...
- AC米兰队史今天:2005年3比1尤文,马尔蒂尼PK伊布+众将围殴穆图
-
AC米兰队史今天:2005年3比1尤文,马尔蒂尼PK伊布+众将围攻穆图2005年10月29日,2005-2006赛季意甲第10轮的一场焦点对决在圣西罗上演,AC米兰坐镇主场迎战老妇人尤文图斯。强强死磕...
- 如果2005年西部全明星阵容VS2021年全明星阵容
-
#NBA全明星#如果2004-05赛季的西部全明星阵容,分别对阵今年的詹姆斯和杜兰特队,会孰强孰弱呢?首先我们来看看2004-05赛季西部全明星的阵容,首发球员是:科比、麦迪、加内特、邓肯、姚明;替补...
- EtherCAT从站EEPROM更新操作指南_ethercat stm32从站
-
@ZHangZMo升级EtherCAT从站EEPROM...
- LAN8820I-ABZJ/MICROCHIP/微芯/代理现货库存/以太网/太航半导体
-
描述微芯片lan820/lan820i是低功率100BASE/100BASE/1000BASE-TX/1000BASE-TX/100000base是由IEEE802.3和802.3ab...
- 汽车的发明者到底是谁?哪一年?百年历史的汽车品牌有哪些
-
今天是解读大学本科汽车专业教材《汽车构造》解读的第一期“总论”部分。后面将以教材内容为基础,并结合汽车发展现状做有一些更丰富的延展,同时补充进一些相关的常见故障及维修内容。华歌通俗易懂讲原理的讲解方...
- 嵌入式Linux自学不走弯路!670+讲课程!应用层+底层系统学习路线
-
在智能设备爆发式进化的今天,智能设备正从单点控制迈向系统级智能。从工业机械臂的精准控制到智能座舱的多屏交互,从边缘AI推理到云端协同,...
- 从cpu角度理解PCIe_cpuz pcie
-
举报Herok...
- 什么是big.LITTLE,你真的了解吗_big 是什么
-
2015年最佳智能手机阵容处理器均基于ARM的big.LITTLE架构,采用该架构处理器的手机工作速度更快更高效。三星GalaxyS6、HTCM9、LGG4等手机均采用基于big...
- 网上疯传的乌克兰战争片段,其实是一段游戏视频
-
希望人没事。...
- 《爱奇艺视频》UWP已悄悄更新ARM版,支持Win10 Mobile部署安装
-
此前IT之家报道过,爱奇艺视频(Beta版)已经推出Win10UWP版,适配Windows10PC系统,Win10Mobile还不能下载,不过现在有IT之家网友发现,爱奇艺视频(Beta版)商店里已...
- Arm版Chrome/Edge浏览器新改进:加速视频渲染、延长续航时间
-
IT之家6月29日消息,科技媒体WindowsReport昨日(6月28日)发布博文,挖掘ChromiumCommit发现了“EnableMediaFoundationA...
- ARM全新视频处理器Mali Egil曝光:支持VP9编解码
-
5月30日,ARM正式发布了其最新的图形处理器Mail-G71,基于ARM全新的GPU架构“Bifrost”,并且结合了线程级并行(TLP)设计。实际上,完整的MaliGPU基于ARM图形产品堆栈设...
- 2020年手机最全资源app网站合集,你要的基本上都有
-
手机最全资源app合集,你要的基本上都有聚BT:(最强资源聚合网站)https://jubt.net安卓老子追剧+安卓南瓜影视破解版+安卓香蕉影视+韩剧TV安卓:https://www.lanzous...
- 闰秒宣布取消,网友:让Linus本人与谷歌微软达成一致,只有它了
-
詹士发自凹非寺量子位|公众号QbitAI决定了!这一秒,程序员们不用再续了!...