2020 DEMO CHINA首次进入成都,解码智慧经济新时代
网独家获悉,近日,华为召开内部会议,成立AI算力平台先遣组和数据中心军团,计划全力支持国内所有大模型的算力需求
滴滴也将持续听取大家的意见和建议,不断改进服务、提升体验。同时,滴滴为用户提供了滴滴567,邀请好友助力得30元无门槛优惠券等多种出行优惠活动,用户可下载滴滴出行APP,体验清凉一夏美好出行
即日起至9月30日,在全国300多座城市,司机师傅在奖励时段和区域内出车完单,配合乘客需求开关空调,可获得清凉一夏专属高温补贴。雷峰网(公众号:雷峰网)。根据不同城市天气情况,司机师傅可获得不同额度的高温补贴,在北京、上海、郑州、深圳、武汉、青岛、济南、重庆、宁波、贵阳、成都、杭州、福州、海口等城市陆续上线,可获得最高补贴金额100元,请师傅们关注所在城市的滴滴车主端奖励通知,及时领取奖励。滴滴希望通过高温补贴鼓励司机配合乘客开空调的需求,但也恳请司乘互相多一些理解。滴滴今日发布公告,在广泛听取广大司机和乘客的建议后,滴滴启动清凉一夏计划,在暑期3个月期间,为司机师傅们发放5亿元高温补贴,和司机共担夏日出车成本,鼓励司机配合乘客需求开空调,共同提升夏日出行体验。
同时,滴滴为用户提供了滴滴567,邀请好友助力得30元无门槛优惠券等多种出行优惠活动,用户可下载滴滴出行APP,体验清凉一夏美好出行。滴滴也将持续听取大家的意见和建议,不断改进服务、提升体验。但我认为,未来有价值的工作会是在训练微调的技术上精进,并将微调工作规模化,为企业大模型落地走完最后一公里路,而不是处在于做同质性的大模型。
如果一个企业创建了一个模型,然后将这个模型交给了他人,可能整个企业的机密就无法保障了。与谷歌和微软保持闭源策略不同,Meta的LLaMA是开源的(参数权重除外),其在整个开源世界的影响力远超谷歌和。雷峰网:具体怎么帮企业做落地?简仁贤:我们提供的服务相当于预先训练好基础模型,将该模型部署到我们的大模型工厂(LLM Factory))上,再将其部署到客户端,允许客户使用自己的数据来训练自己的模型,并自动集成到企业的应用中。雷峰网(公众号:雷峰网):这是我们和其他厂商相比,最具优势的地方吗?简仁贤:对。
其实对于我们来说,创建大模型不难的,因为我们有know-how,真正的难点在于客户需要整理数据。作者丨何思思编辑丨林觉民2015年从微软离职的简仁贤,创办了竹间智能,从成立之初,竹间智能就专注于AI技术的研发,并在NLP(自然语言处理)领域下足了功夫。
雷峰网:安全问题保证了,对于竹间来说做大模型最难的是什么?简仁贤:数据梳理。发布会所看到的大模型并不一定具备可商用化的质量,我们重视的是如何将模型打造成可商用化的大模型,务实地帮助企业实现大模型的落地。雷峰网:竹间的大模型是自研的还是?简仁贤:我们的大模型开发有两种方式:一是自主研发,二是基于其他预训练的大模型进行开发。此外,我认为企业所需的并非仅仅是一个大模型,而是多个大模型,使用 EmotiBrain Model Factory,能高效训练微调大模型,更能进一步降低成本。
竹间智能作为一家初创企业为何选择去填补这块空白?其实从简仁贤以往的履历中就能得到答案2006年加入微软负责Bing核心产品的研发、2012年担任微软亚洲互联网工程院副院长,负责微软亚太地区的搜索及AI产品的技术研发,并主导开发微软小娜(Cortana)......可以说,这些宝贵的经验是竹间智能研究NLP的弹药,但这并不意味着其NLP的研发之路是一帆风顺的。因此,企业的目标应该是让每个人都能使用到技术,而不是向外界夸耀自己的技术有多么强大。实际上,由于不可控的因素,数据安全的隐忧,许多国家和企业已经开始限制使用ChatGPT。目前,我们正在与数十个客户进行商谈,他们对大模型还是比较接受的。
雷峰网:和以前相比,客户的态度有转变吗?简仁贤:我们之前也推广过大模型,花费了大量时间去教育市场和客户,但是由于门槛比较高,客户也需要购买GPU,当时很多客户并没有充足的预算,也无法理解大模型能带来的实际效果,所以推广效果并不明显。因为在简仁贤看来,等大模型火了之后再做就来不及了,很多东西等所有人看明白后再去做就是红海了。
反观国内大模型的发展,确实如此。数据梳理和数据标注是两个概念。
目前要把大模型用好,需要很好的提示词,这个99%以上的人是不会的,绝大多数的人他们只关心自己所使用的产品的性能能不能给他们带来价值,所以应用最重要。我们的愿景是让每个人都能拥有一个机器人。那么,如何架设一座桥梁跨越这个鸿沟呢?这座桥就是应用,就是产品。简仁贤坦言,现在人们更愿意每天在媒体上面看谷歌怎么样了,Meta怎么样了,OpenAI怎么样了,谁谁谁怎么样了,这些都是趋势,不能反映企业内部的问题,这时大模型厂商真正要做的是,在企业预算资源有限的情况下,帮助企业把大模型融入到业务系统中,做增强,做赋能。因此,每一家企业都会想要建立自己的大模型,这为我们带来了万亿级别的商机,即如何帮助企业快速建立大模型。只能使用通用大模型来解决通用问题,例如撰写文章、修改文章等简单任务。
雷峰网:竹间做这件事情,对企业最大的好处是什么?简仁贤:对于绝大多数的企业客户来说,他们无法投入数千万资金进行从0开始的基础大模型的预训练,即使有资金也无法做得到,数据,算力,know-how,维护等。雷峰网:所以让客户低成本的享受大模型的能力,也是我们重点要做的?简仁贤:我们的目标就是将人工智能平民化,让所有的企业都有自己的大模型,都能负担得起的大模型,甚至我们设定一个目标:成立99万大模型试验室,让企业在99万的预算内即可打造一个企业自有的大模型,让大模型变得更为平民化。
我在之前几次演讲中也提到过,模型与用户之间存在着一道巨大的鸿沟。目前竹间智能已经为600多家客户做了NLP的落地。
但如果你说:我有一个应用程序,你只需对它说几句话,它就能帮你写信。雷峰网:机器人的概念怎么理解?简仁贤:机器人的中枢就是大模型,但这个机器人是一个应用,它可以帮助人们完成任务。
这就是我们的价值观——只有模型是没有用的,正如OpenAI一样,尽管它的很多论文很难懂,但是它创造出了ChatGPT这个应用,给大模型一个与人类沟通的一个界面,将大模型到应用的全过程实现了,让全世界都能在一个界面上利用大模型完成各种任务,因此它才能如此成功。如今,我们已经拓展了原有积累多年的自动化机器学习平台和数据标注运营平台,因此在这个系统上,我们可以训练微调出许多不同的大模型,依照企业的需求,实现专属于企业的定制化行业大模型的落地。这个模型留在客户端,属于客户所有,而不是我们。当然,很多国内外的大企业或上市公司都拥有自己的数据,但缺乏的是数据梳理方法——如何沉淀优质数据,然后去训练模型?这是最大的挑战。
我们在自然语言处理(NLP)领域的深耕已有近8年,大语言模型也是NLP领域,最大的突破是生成式AI以及将大语言模型训练工程实现,现在企业面对的挑战是如何克服大模型的落地的种种挑战,将大语言模型应用到业务场景中,达到业务的效果,而不是只有炫技。雷峰网:为什么谷歌、微软不开源?简仁贤:简单来说,他们需要通过这些模型来提高他们主营业务的获利,以提高他们的竞争力,对业务有价值的核心技术,谁会开源?雷峰网:听下来发现,竹间更倾向于做B端,那会不会像谷歌微软一样做超级巨大模型?简仁贤:我们的目标并非是直接为三、四亿用户服务的超大模型,这是大企业的工作。
大模型自研与否不重要,关键要走最后一公里路雷峰网:您怎么定义竹间在大模型方面的服务模式?简仁贤:我们提供Model-as-a-Service,模型即服务,这意味着我们的产品和工具平台可以快速帮助客户构建模型,而且这个模型可以迅速地与企业的业务系统进行连接。不做C端,瞄准B端,坚持做企业级大模型产品雷峰网:和前几个月相比,您对大模型的发展有改观吗?简仁贤:近期大模型的发展和我几个月前的预测存在一些出入。
之后谷歌的PaLM 2也用了 GPT-4 来生成训练数据。1万个GPU的费用超过2亿美元,我们的客户,绝大多数现阶段都无法投入这么大的资金去开发超大模型,尤其是当这么大的模型并不是直接解决业务问题的。
雷峰网:多了一个应用,这个逻辑是怎么推论出来的?简仁贤:我始终坚信,能够触及用户的产品才是最具价值的。但值得注意的是,彼时国内对NLP的研发还处于空白,也没有一款成熟的NLP产品出现。雷峰网:所以说,这也是对客户的挑战?简仁贤:对。在有限的预算内,帮助企业将大模型融入业务系统,才是真正值得我们关心的大模型发展趋势。
各种模型都可以有不同大小的 size, 不同数量级的参数,这就好比我们喜欢的衣服有S、M、L、XL、XXL各种尺码,我们可以从以前的S尺码模型做到现在的M、L,甚至是XL尺码的模型。如果没有,就很难进行,需要从数据收集和准备训练数据做起。
雷峰网:怎么帮客户解决这个问题?简仁贤:在数据梳理的过程中,不存在所谓的弯道超车,必须积累行业经验和know-how。自2021年GPT2问世,我们就开始关注了,并将机器学习平台向大模型开发方向迁移。
雷峰网:大模型工厂(LLM Factory)是大模型火了之后开始做的吗?简仁贤:不是,从2021年起,尽管大模型当时并未大热,竹间就开始关注大模型了,2022年中开始研究,现在我们已在内部进行应用实践。我们会根据客户的需求帮他们定制适合的模型,无论是70亿参数,130亿参数,还是650亿参数的大模型,都在我们大模型工厂(LLM Factory)的服务范围内。
扫一扫关注我们
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至 5MoBan@YunYunAn.Com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容【后台-全局配置-定制标签-内容页声明修改】。
标签: 蚌埠院与沙河市共建国家玻璃节能工程中心 玻璃易碎 持仓谨慎 春运圆满收官 厦航运送旅客275万人次 玻璃:强势格局持续 俄航正考虑向中国多个城市增发航班 海外光伏企业虎视眈眈中国光伏市场 政策利好引诱 光伏电站开发乱象更新 浙江水晶工艺制品协会召开2012年二届二次会员大会 景德镇浮梁通用机场试运营,为该市首个A1类通用机场 格尔木光伏电站三期项目成功并网发电 罗尔斯-罗伊斯宣布遄达XWB-97史上最大订单 十二五规划光伏装机容量扩大内需成基调 2023年春运“大考”圆满收官 襄阳机场平安运送旅客21.36万人次 51万手巨量持仓玻璃货物再封涨停 换季上新!西部航空2023年夏航季新开/重开/加密航线 玻璃技术回调,等候逢低做多 图木舒克机场邀请天缘航旅贵宾部开展服务礼仪提升训练 玻璃板块:盈利趋势反转确立 玻璃货物一个月涨逾16% 成交量跃居靠前 民航海南空管分局终端设备室党支部召开2022年度组织生活会
相关文章
热点文章
双胞胎姐妹,相逢在北大!
世界光伏产业投入资金峰会把握光伏发展趋势
西藏产权交易中心成立拉萨房产签约服务中心
阿拉尔机场组织开展2023年春运服务保障工作总结会
北方升温为主南方多地降温持续 明起新一轮降水过程将影响我国
泸州太阳能光伏玻璃项目快速推进