新火种AI|大厂围剿,“长文本”成不了Kimi的护城河

news/2024/4/28 7:32:57/文章来源:https://blog.csdn.net/2301_81027856/article/details/137126540

作者:一号

编辑:美美

长文本之后,Kimi能找到新的“护城河”吗?

过去的一周,由AI技术天才杨植麟的大模型初创企业月之暗面及其产品Kimi所带来的连锁反应,从社交媒体一路冲向了A股,带动了一批“Kimi概念股”的大涨。这也是国内AI创业公司第一次真正意义上的“破圈”。

资本市场的关注,也让Kimi迎来了用户量的飙升,根据“AI产品榜(aicpb.com)”的数据,Kimi智能助手在2024年2月份的访问量达到了305万,比上个月增长了107.6%,3月8日至3月14日的周访问量更是达到了183万,环比增加了45%。流量的激增,也让Kimi在3月20日出现了宕机等异常现象。

而这一次的爆火始于3月18日,月之暗面宣布其自研的Kimi智能助手在大模型上下文窗口技术上取得了新的突破,已支持200万字超长无损上下文,并即日起开始产品内测。我们不禁要问,大模型能力这么多,为何长文本会成为引爆点?

为什么长文本是用户的痛点?

对于大模型的长文本的能力,月之暗面的创始人杨植麟把它解读为“新计算范式”,并认为通用的世界模型,是需要“长文本”的。

想象一下,如果你把一个大模型当做一个和你对话的人,它跟我们一样,有短期记忆和长期记忆。而长期记忆就是它通过模型训练得到的向量和参数,你可以把这当成它的知识库。而上下文就是它的短期记忆,当你在和它对话的时候,你们之间的对话内容就是以上下文窗口的形式提供给了大模型,要是你们的对话长度超过了这个它的上下文承载能力,那么超出的部分,大模型就会忘记。这从根本上就限制了大模型处理一些复杂多变的任务的可能。

为了让大模型能够完成更多的任务,或者说让它不会在跟你对话过程中突然就没办法跟你继续对话下去了的问题,拓展上下文就成了一件必须解决的事情。也只有这样,AI才能在面对一些描述非常复杂,需要举例帮助模型进行学习等的任务上表现得更好。如果以AGI为目标,那上下文长度的突破更是必须的。

而从市场上看,当前使用大语言模型的大多数人群,无论是泛科技行业,还是从业者、爱好者或者学生,解读论文、深度研报还有会议摘要等这些明确的应用场景,长文本能力都是刚需。因此,OpenAI的开发者关系经历Logan Kilpatrick就曾经说过,“上下文就是大语言模型的下一个关键突破”。

因长文本而备受关注的Kimi

很明显,月之暗面“登月”的第一步,从用户需求的角度上来讲,肯定是迈对了。早在2023年10月,Kimi刚刚上线的时候,它就以一个很有辨识度的方式进行了亮相。他们在官宣文章的标题上,别出心裁地用了“欢迎与Moonshot AI共同开启Looooooooooong LLM时代”,通过加了很多个“o”的long,从视觉上就让人印象深刻,明白这个大模型与“长”相关,然后文章的第一句就是“今天,Moonshot AI 带着首个支持输入 20 万汉字的智能助手产品Kimi Chat 与大家见面了”。

这些宣发内容,都让人能够很快地将“长文本”和Kimi之间构建起联系,通过这样的营销方式,月之暗面轻松地占领了用户心智,从此要是聊起“长文本”,“月之暗面”就成了一个很容易被提到的公司。

在当时不停“卷”的大模型市场上,新模型不断冒出,而绝大部分的模型介绍都有这么一套标准动作:公布模型参数、模型是开源还是封闭的、公布测试集成绩,体现自己成绩有多好,然后就是一些业内人士的介绍或评测文章。

虽然数据清晰,但如果是面向大众市场,显然这些晦涩难懂的参数和技术词语,只能是自嗨,远不及一个直白的特点更让人印象深刻。因此月之暗面用这样的具有辨识度的方式,很轻松地就从一众大模型中脱颖而出,轻松地赢得了普通用户的心。

而且在后续的宣发中,月之暗面也在不断重复和强调kimi的长文本能力,直到最近,它所做的突破也是在长文本这个能力上。因此,当用户将长文本=Kimi的时候,除非竞争对手拥有碾压级的实力,否则都很难威胁到Kimi在用户心中的地位。

但“长文本”真的能保Kimi永久平安吗?

长文本成不了Kimi的“护城河”

同样在长文本上做文章的,在海外,还有一家名为Antropic的公司。作为被公认的OpenAI最强大的对手,他们的大模型Claude的杀手锏就是长文本。在其初代模型推出时,就支持100k token的上下文,可以直接处理5万字,这也让它一直在整体性能劣于OpenAI的情况下,也能保有一群核心粉丝。

然而这种优势也并未能保持太久。去年11月,OpenAI在Dev Day上发布了GPT-4 Turbo,支持128k的上下文,这让Antropic陷入了危机,不得不紧急推出Claude 2.1,将上下文从100k提升到了200k。但后来被人进行了探针测试,显示它只是支持了这样的长度,但并未记住其中的内容,使得它紧急打了补丁。而这个补丁,仅仅只是一句Prompt

今年2月,谷歌的Gemini 1.5则直接将上下文推到了100万。种种迹象都表明,长文本能力的“护城河”已经在变浅。就在前段时间,Antropic号称超越GPT-4的“世界最强大模型”Claude 3也放弃了在长文本上开卷,依然只支持200k的上下文,转而在其他能力上进行了升级。

同样,在国内,Kimi爆火之后,“长文本”的需求也被大厂看到了。很快,阿里巴巴宣布通义千问重磅升级,向所有人免费开放1000万字的长文档处理功能,成为了全球文档处理容量第一的AI应用;紧接着,百度的文心一言将在下个月开放200万-500万字的长文本能力;360智脑也正式内测500字长文本处理能力。

据新浪科技获得的数据,Kimi当前每日获客成本高达20万元。面对大厂在长文本能力上的集体围剿,作为AI创业公司的月之暗面,在资金还有算力资源上,都难以招架。因此,尽管当前月之暗面仍有足够的“忠粉”,但当热情褪去,若月之暗面还未挖出一条新的“护城河”,恐怕难逃困境。

作为“坚定的AGI信徒”,杨植麟也有过这样的判断,“独特价值是你增量的智能。要抓住这个点,智能永远是最核心的增量价值。如果你这个产品最核心价值只有10%-20%来自于AI,就不成立”。

因此,究竟“智能”能否成为Kimi新的“护城河”,我们只能拭目以待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_1027097.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Java程序设计】【C00392】基于(JavaWeb)Springboot的校园生活服务平台(有论文)

基于(JavaWeb)Springboot的校园生活服务平台(有论文) 项目简介项目获取开发环境项目技术运行截图 博主介绍:java高级开发,从事互联网行业六年,已经做了六年的毕业设计程序开发,开发过…

LeetCode_1.两数之和

一、题目描述 二、方法 1.方法1&#xff08;暴力枚举法&#xff09; 利用两个for循环&#xff0c;对数组进行逐一的遍历&#xff0c;直到找到两个数的和为目标值时返回这两个数的下标。以下为c实现的完整代码。 # include<iostream> using namespace std; #include<…

大数据开发扩展shell--尚硅谷shell笔记

大数据开发扩展shell 学习目标 1 熟悉shell脚本的原理和使用 2 熟悉shell的编程语法 第一节 Shell概述 1&#xff09;Linux提供的Shell解析器有&#xff1a; 查看系统中可用的 shell [atguiguhadoop101 ~]$ cat /etc/shells /bin/sh/bin/bash/sbin/nologin/bin/dash/bin/t…

javaWeb项目-火车票订票信息系统功能介绍

项目关键技术 开发工具&#xff1a;IDEA 、Eclipse 编程语言: Java 数据库: MySQL5.7 框架&#xff1a;ssm、Springboot 前端&#xff1a;Vue、ElementUI 关键技术&#xff1a;springboot、SSM、vue、MYSQL、MAVEN 数据库工具&#xff1a;Navicat、SQLyog 1、Spring Boot框架 …

【Linux C | 多线程编程】线程的创建、线程ID、线程属性

&#x1f601;博客主页&#x1f601;&#xff1a;&#x1f680;https://blog.csdn.net/wkd_007&#x1f680; &#x1f911;博客内容&#x1f911;&#xff1a;&#x1f36d;嵌入式开发、Linux、C语言、C、数据结构、音视频&#x1f36d; ⏰发布时间⏰&#xff1a;2024-03-22 0…

#Linux(SSH软件安装及简单使用)

&#xff08;一&#xff09;发行版&#xff1a;Ubuntu16.04.7 &#xff08;二&#xff09;记录&#xff1a; &#xff08;1&#xff09;终端键入&#xff08;root权限&#xff09;安装 apt-get install openssh-server 安装时遇到报错 E: Could not get lock /var/lib/dpkg/…

如何用c解决汉诺塔问题!

汉诺塔&#xff08;Tower of Hanoi&#xff09;&#xff0c;又称河内塔&#xff0c;是一个源于印度古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石柱子&#xff0c;在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘。大梵天命令婆罗门把圆盘从下面开始按大小顺序重…

深入解析Spring MVC: 原理、流程【面试版】

什么是SpringMV? 1.是一个基于MVC的web框架&#xff1b; 2.是spring的一个模块&#xff0c;是spring的子容器&#xff0c;子容器可以拿父容器的东西&#xff0c;但是反过来不可&#xff1b; 2.SpringMVC的前端控制器是DispatcherServlet&#xff0c;用于分发请求。使开发变…

Git工具的详细使用

一、环境说明 [rootgit ~]# getenforce Disabled [rootgit ~]# systemctl status firewalld ● firewalld.service - firewalld - dynamic firewall daemonLoaded: loaded (/usr/lib/systemd/system/firewalld.service; disabled; vendor preset: enabled)Active: inactive (d…

数据库的横表和竖表

先来看个图: 定义如下&#xff1a; 横表&#xff1a;在一行数据中包含了所有的属性&#xff0c;一行就代表了一个完整的实体 竖表&#xff1a;在一行中只存储一个实体的一个属性&#xff0c;多个行组合在一起才组成一个完整的属性适用场景&#xff1a; 横表&#xff1a;对查…

使用easyYapi生成文档

easyYapi生成文档 背景1.安装配置1.1 介绍1.2 安装1.3 配置1.3.1 Export Postman1.3.2 Export Yapi1.3.3 Export Markdown1.3.4 Export Api1.3.6 常见问题补充 2. java注释规范2.1 接口注释规范2.2 出入参注释规范 3. 特定化支持3.1 必填校验3.2 忽略导出3.3 返回不一致3.4 设置…

术语技巧:如何格式化网页中的术语

术语是语言服务中的核心语言资产。快速处理英汉对照的术语是我们在翻译技术学习过程中需要掌握的必备技能。 通常&#xff0c;我们需要把在权威网站上收集到的术语放到word当中&#xff0c;调整正左右对齐的样式&#xff0c;便于打印学习或者转化为Excel表。 如何快速实现这一…

【QT入门】 Qt代码创建布局之setLayout使用

往期回顾&#xff1a; 【QT入门】 Qt代码创建布局之水平布局、竖直布局详解-CSDN博客 【QT入门】 Qt代码创建布局之栅格布局详解-CSDN博客 【QT入门】 Qt代码创建布局之分裂器布局详解-CSDN博客 【QT入门】 Qt代码创建布局之setLayout使用 一、setLayout 1、什么是setLayout …

Day42:WEB攻防-PHP应用MYSQL架构SQL注入跨库查询文件读写权限操作

目录 PHP-MYSQL-Web组成架构 PHP-MYSQL-SQL常规查询 手工注入 PHP-MYSQL-SQL跨库查询 跨库注入 PHP-MYSQL-SQL文件读写 知识点&#xff1a; 1、PHP-MYSQL-SQL注入-常规查询 2、PHP-MYSQL-SQL注入-跨库查询 3、PHP-MYSQL-SQL注入-文件读写 MYSQL注入&#xff1a;&#xff…

酒店能源监测管理系统:实现节能减排与提升管理效率的利器

随着全球能源问题的日益突出和可持续发展理念的深入人心&#xff0c;酒店业也在积极探索节能减排的途径。在这一背景下&#xff0c;酒店能源监测管理系统应运而生&#xff0c;成为了酒店行业提升管理效率、降低能源消耗的重要工具。本文将从多个角度介绍酒店能源监测管理系统的…

yolov9目标检测可视化图形界面GUI源码

一&#xff1a;软件简介 该系统是由微智启软件工作室基于yolov9pyside6开发的目标检测可视化界面系统 功能介绍&#xff1a; 支持图片、摄像头、视频检测、文件夹目标检测支持修改成自己的yolov9模型&#xff0c;自定义识别&#xff08;需是未改进网络训练的数据集&#xff09;…

腾讯云免费云服务器申请流程详解

随着云计算的普及&#xff0c;越来越多的企业和个人开始选择使用云服务器。腾讯云作为国内领先的云计算服务提供商&#xff0c;为用户提供了丰富的云产品和服务。本文将为大家详细介绍腾讯云免费云服务器的申请流程。 一、注册腾讯云账号 首先&#xff0c;需要注册一个腾讯云账…

Linux基础系统设置与备份策略

文章目录 Linux基础系统设置网络设置(手动设置与DHCP自动获取)&#xff1a;nmcli、hostname日期与时间设置&#xff1a;timedatectl、ntpdate语系设置防火墙简易设置 Linux 服务器硬件数据的收集&#xff1a;dmidecode、lspci、lsusb、iostat了解磁盘的健康状态Linux 备份要点确…

Stable Diffusion XL之核心基础内容

Stable Diffusion XL之核心基础内容 一. Stable Diffusion XL核心基础内容1.1 Stable Diffusion XL的主要优化1.2 SDXL整体架构初识1.3 VAE模型1.VAE基本介绍2. VAE基本模型结构3.VAE的训练 1.4 U-Net模型&#xff08;Base部分&#xff09;1. 十四个基本模块概述2. SDXL_Spatia…

Java全栈课程之Linux———基本属性

一、看懂文件属性 Linux系统是一种典型的多用户系统&#xff0c;不同的用户处于不同的地位&#xff0c;拥有不同的权限。为了保护系统的安全性&#xff0c;Linux系统对不同的用户访问同一文件&#xff08;包括目录文件&#xff09;的权限做了不同的规定。 在Linux中我们可以使…