百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 小说推荐 > 正文

《红楼梦》txt全集下载,《红楼梦》epub下载,《红楼梦》mobi下载,《红楼梦》全本精效版下载,电子书下载 - 奇书网

haoteby 2025-10-29 19:35 1 浏览

《红楼血泪史》,索隐派红学的扛鼎之作

长文本对大模型而言为何重要?

|孙欣

编辑|姚赟

头图来源|视觉中国

万字,意味着什么?《埃隆·马斯克传》万字,《红楼梦》万字,《后宫甄嬛传》万字。如果按照分钟看1万字的阅读速度来计算,1小时阅读3万字,那么万字大概要读个小时。

而这样马拉松式的阅读,大概率是囫囵吞枣。

3月日,国内AI创业公司月之暗面(Moonshot AI)宣布在大模型长上下文窗口技术上取得新的突破,Kimi智能助手已支持万字超长无损上下文,并于即日起开启产品“内测”。而后,各大公司跟进,卷起了文本长度。日,阿里通义千问向所有人免费开放万字的长文档处理功能;日,智脑宣布内测可处理万字功能。

也就是说,现在,分钟左右Kimi、通义千问、智脑等产品就可以读完《埃隆·马斯克传》《红楼梦》《后宫甄嬛传》三本书,且能结合上下文理解其中的内容。

实际上,长文本早已是AGI(通用人工智能)的必争之地:年月,OpenAI发布了GPT4 Turbo,最高支持128k上下文长度的输入;天后,Antrophric紧急发布Claude ,宣布上下文能力的突破,从100k提升到了200k;年2月,Gemini 宣布长文本窗口支持100w长度,为万文字。

那这些数字和标准到底意味着什么?长文本上下文处理能力到底是什么功能?我们挑选了Kimi、通义千问、Claude等产品进行测试体验。

Antrophric的Claude,此前一直以抢眼的长文本处理能力被人认可;阿里的通义千问目前可处理万文字,字数量级属于第一梯队;Kimi因长文本上下文处理能力让月之暗面在国内AI创业中首次出圈。

第一步:把Kimi、通义千问、Claude“喂成”马斯克

“如果有机会,我当然愿意和雷军交流。”Kimi化身马斯克对我说道。

为了更好地测评长文本上下文处理能力,我们同时给Kimi、通义千问、Claude输入约万字的《埃隆·马斯克传》,并让它们用马斯克的思维和语气来和我们进行对话。

(1)最多可同时上传个文件,支持多种格式

当我们输入文档时,三者解析条件和所用时间相似。

通义千问解析文档,可同时上传个文件,每个不超过150MB,支持PDF、Word、Excel、Markdown、EPUB、Mobi、txt等形式。

Kimi解析文档可同时上传最多个,每个不超过100MB,支持doc、xisx、PPT、txt、图片等文件形式。值得注意的是,Kimi需要申请长文本上下文能力内测资格,申请通过后即可免费使用。

Claude解析文档可同时上传最多5个文件,每个文件不超过10MB,支持docs和images文件形式。因此当文档较大时,我们需将其分解成几个不超过10MB的docs文件开始解析。

(2)联网的Kimi更懂端妃

我们分别输入了约万字的《后宫甄嬛传》小说,并对它们进行提问。“你认为《甄嬛传》中谁最有可能成为一个成功的企业家?”几秒钟后我们分别得到了这样的回答。

Kimi给出了甄嬛、沈眉庄、华妃、端妃、皇后五个答案,并对每个答案进行了分析。如,甄嬛是因为“能够在复杂的后宫环境中生存并逐步提升自己的地位”,沈眉庄是因为“稳重和深思熟虑”,华妃是因为“在后宫中拥有较高的地位和权力”,皇后是因为“作为后宫之主”。

Kimi的这一回答中,给端妃的理由比较有趣,在书中没有直接写到。Kimi认为端妃是因为“虽然在小说中不如甄嬛和华妃那样显眼,但她能够在后宫中保持一定的地位和影响力,说明她在人际关系和个人发展上的‘投资’也相对成功”。

而Claude却给出了一个在《后宫甄嬛传》中不存在的角色——纯妃,并给纯妃设定了有洞察力、判断力、虚心求教、勤奋好学、擅长处理人际关系、勇于创新、坚韧等品格设定。

3月日,Kimi在官方发布直播中,月之暗面AI Infra负责人许欣然提到了一万小时定律,即要想成为一个领域的专家,我们至少需要学习一万小时。而现在只需要分钟,Kimi就能接近任何一个新领域的初级专家水平。

在直播中,许欣然还现场输入了约万字的《倚天屠龙记》复印件、万字的《甄嬛传》剧本,不到分钟,Kimi就成了“倚学家”“甄学家”。

我们继续测试。

我们在未向Kimi提供《埃隆·马斯克传》时,输入了“请以马斯克的思想和语气与我对话”。

Kimi在开始和最后都强调了本次回答是“模仿马斯克的风格”,并不代表其本人和相关公司的真实观点。面对这个问题,化身为马斯克的“K斯克”是这样评价雷军和小米SU7的。它认为,“雷军是一位非常出色的企业家”“小米SU7汽车是一个非常有趣的产品”。最后还给出了建议,“作为一家新进入电动汽车领域的公司,小米还有很长的路要走。他们需要在技术创新、生产效率、供应链管理等方面不断努力。”

我们又将该书“喂”给了Kimi,解析此书后,它给出相似的回答。

我们重复了上一步,将同样的问题给到通义千问。通义千问给到的回答中,关于小米SU7的内容为:“虽然具体型号和细节在现实中可能不存在,但基于小米进入电动汽车领域的假设……”

如法炮制,继续测试Claude,结果与通义千问相似。

据了解,作为大模型产品,Kimi除了文档解读,还有联网功能。这意味着,Kimi不但可以使用既定资料分析,还可以根据问题搜索全网信息作为数据分析依据。目前,ChatGPT 、Claude 不支持这项功能。

(3)文档检索三者能力相近

为了测试Kimi、通义千问、Claude的文档内容理解功能,在向三者都输入了《埃隆·马斯克传》之后,我们针对于书中的内容进行了提问。

针对该书同一个问题,三者的回答相似且较为准确,都提到了马斯克觉得这是《蝇王》故事现实版,分到少量的食物和水,瘦了磅等细节。

(4)Kimi看到了马斯克的成功者特质,Claude更关注马斯克的内心世界

在一个聊天框中输入的内容被称之为“上下文”。上下文之间的理解能力也至关重要,段落之间割裂,会导致上下文信息的丢失,对于AI给出答案的准确度也有影响。

例如,如果用户在对话中提到了特定的话题或问题,具有上下文能力的AI可以记住这些信息,并在后续的对话中引用它们,以提供连贯和相关的回答。这种能力对于创建自然、流畅的对话体验非常重要。

为测试三者上下文文本处理功能,我们提问了马斯克岁时的学校经历后,追问了“马斯克的性格是怎么样的”。

Claude给出了狂热执着、冷酷无情、戏剧化、顽强坚韧、双重性格等特征,同时,针对这些特征一一进行了分析。如狂热执着是因为“他对现实宏伟目标如开发电动车、登陆火星等怀有先知般的狂热和使命感。这种狂热忽视了他的笨拙,也促使他勇于冒险并承担极高的风险”。

通义千问也提到了宏大愿景、推动普及电动车、移民火星等内容。区别是,通义千问将这些“理想主义与远见卓识”,将马斯克形容为“坚信通过科技可以解决人类面临的问题”。

Claude、通义千问和Kimi给出的这些特质中,也都提到了马斯克冷酷无情、双重性格、戏剧化、矛盾性等“负面”特征。Claude将马斯克总结为“性格狂热、冷酷、喜好戏剧化、坚韧顽强,但又带着某些孩子般的天真和脆弱”。而Kimi将其总结为“非常独特的个体”,并认为他在科技和商业领域的成就很大程度上得益于这些性格。

长文本,AI“登月”第一步

长文本对大模型而言为何重要?

“为什么长文本是‘登月’第一步?它很本质。它是新的计算机内存。”月之暗面创始人、CEO杨植麟曾在腾讯科技的采访中表示,长文本(Long Context)是大语言模型(LLM)的基础能力。

此前,杨植麟用了形象的比喻来描述长文本,“支持更长的上下文”意味着大模型拥有更大的“内存”。

年月,Kimi上线,当时可以支持无损上下文长度最多为万汉字。5个月内,升级至万字,月之暗面直接将长文本能力提高至倍。按照AI领域的计算标准,万汉字的长度大约为万token。而当时长文本水平在第一梯队的谷歌Gemini 、Claude 3支持万token,Kimi 万汉字上下文长度超越了海外顶尖大模型水平。

与衡量手机、电脑性能时的“跑分”类似,大模型也有专属的“跑分”标准,被称之为token。它是一个大模型输入、输出的基本单位。以OpenAI的相关准则来看,1k的token等于个英文单词、个中文汉字。token越大,文本处理能力越强。据了解,当前ChatGPT 4的token是32k,Claude 3的token是100w ,Kimi的token是400w。

也就是说,可处理的文本越长,可提取内容时的素材越多,帮助用户处理信息时则越准确。

据统计,长文档处理长度之最来自于阿里云的通义千问,上下文长文本处理能力最强的是来自于月之暗面的Kimi,谷歌的Gemini、Kimi均支持联网功能,不过Ultra大会员需付费,价格是每月美元。

值得注意的是,目前国内的主流长文本处理产品通义千问、Kimi等均为免费申请内测即可使用,随着用户用量的增加,意味着大模型的“训练”数据也在增加,AGI长文本处理赛道正在开卷。

参考资料:

《“Kimi概念”降温,长文本“担不起”大模型的下一步》,腾讯科技

《爆火的Kimi,抢了谁的生意?》,定焦

相关推荐

大灰狼睡前故事(大灰狼睡前故事100篇)

大灰狼敲门。兔妈妈有三个孩子,一个叫红眼睛,一个叫长耳朵,一个叫短尾巴。一天,兔妈妈对孩子们说:“妈妈到地里去拔萝卜,你们好好看着家,把门关好,谁来叫门都别开,等妈妈回来了再开。”兔妈妈拎着篮子,...

只要你过得比我好电视剧(左叔和小米电视剧叫什么)

电视剧《只要你过得比我好》一共有36集剧集简介农村少年孔臭蛋的父母不幸死于一场事故,无依无靠的他在政府的帮助下进入SOS儿童村。臭蛋的新妈妈(沈丹萍饰)和蔼可亲,来自不同家庭却有着同样身世的兄弟姐妹...

茅山后裔完整版txt(茅山后裔完整版txt奇书网)

作者编不下去了,我也看不下去了。《茅山后裔》是2013年百花洲文艺出版社出版的悬疑小说,作者是大力金刚掌。故事说的是张国忠、张毅城父子运用茅山道术踏足天下的故事,从驱鬼镇邪到探秘寻奇无所不及,民间冤案...

九幽至尊(九幽至尊 孤烟)

重生逍遥道万古至尊很好看

一号战尊叶凡谭诗韵小说完结免费

《一号战尊》,作者莫奈何。角色:叶凡,谭诗韵,吴北庆类型:都市言情,男频爽文。简介:为了替母亲治病,叶凡不得已当了中州谭家上门女婿,第二天就奔赴战场。五年归来,叶凡发现四岁女儿竟然和老婆被家族抛弃捡垃...

末世文之女配人生(末世文之女配人生无广告)

末世之幸福女配,小说穿越文,女主叫温妮,男主叫唐锦。是讲述一个女孩穿越进入小说奋斗的故事,男主女主是小说中最大的男配和女配末世之幸福女配,小说穿越文,女主叫温妮,男主叫唐锦。是讲述一个女孩穿越进入小说...

打动女人四句情诗(打动女人四句情诗我的心一直)

第一最好不相见,如此便可不相恋,衣带渐宽,怨秋风悲画扇,第二最好不相知,如此便可不相思,相思枕畔,但凭见泪痕湿,第三最好不相伴,如此便可不相欠,别是一般,剪不断理还乱,第四最好不相惜,如此便可不相忆,...

超神学院之雄兵连第5季全集免费

2022年下半年更新,《雄兵连》是由广州超神影业有限公司(虚拟印象工作室)出品的动画系列作品,是中国首部长篇科幻军事题材的3D热血动漫。《雄兵连》是在《超神学院》系列动画的基础上重新制作了剧情。《雄兵...

蜗居电视剧全集免费播放西瓜视频

第1集  1998年,刚刚大学毕业的郭海萍和苏淳拖着简单的行李来到了属于他们的新家。他们的屋子只是一间10平米左右、老式住房后加的阁楼,卫生间和厨房都是跟邻里共用的。苏淳不禁在斗室中开始畅想拥有一套属...

奇门遁甲电影2(奇门遁甲电影2017周冬雨)

《奇门遁甲2》还没有上映,2021年9月29日,该片在横店正式开机。《奇门遁甲2》是由奇树有鱼、项氏兄弟电影、精鹰传媒出品,项秋良、项河生联合监制、执导,张晓晨、刘雅瑟领衔主演,刘晓庆特别出演的网络电...

正道潜龙百度百科人物介绍(正道潜龙讲的什么故事)

《正道潜龙》中的主要人物包括但不限于:王杨:男主角,是一名具有非凡医术的青年。他以成为“世界首富”为目标,凭借医术和智慧,在创业的道路上不断取得突破。苏梦琪:女主角之一,王杨的初恋女友。她是一个美丽、...

邪气凛然txt下载奇书网(邪气凛然下载小说下载)

结局是陈阳隐居,倪朵朵因深受刺激而失忆。陈阳在叶欢公然叛离青洪后抓住机会一举杀到叶欢大本营,叶欢自尽,小五终是有些复杂的不忍。一年后,他与几个红颜知己在加勒比海上某个小岛过着与世无争的生活——这或许是...

后来我们都哭了txt(后来我们都哭了txt百度网盘)

先说葫芦,也就是叶景尚,因为和朋友在人多的地方飙车,撞死了人,后来找人顶替去坐牢,被发现(一开始没被发现,当时张娜拉还和陆齐铭在一起,知道了葫芦是顶替的,然后去告得密,害死了他),抓了去,自己自杀在监...

下载电视剧全集(功夫战警免费观看网站下载电视剧全集)

1.首先,你需要一部联网的智能手机,手机上需要安装网络视频播放器;打开手机上的网络视频播放器。2.然后进入软件主界面后,点击下方的“导航”找到“电视剧”栏目。3.然后在“电视剧”一栏找到你想看的电视剧...

赘婿2电视剧免费观看(赘婿22电视剧在线观看免费)

冷啸天、江婉儿是电视剧《赘婿出山》的男女角色。是由爱好短视频的朋友自己拍摄。赘婿和赘婿出山名字相似但是是不同的两个剧集。