压缩算法为大语言模型“瘦身”
时间:2024-11-23 10:38:07来源:科技日报
据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。

团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。

CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。

虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。

团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。

不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。

标签:

最新
  • 凯添燃气:8月11日融资买入1.84万元,融资融券余额23.04万元

    8月11日,凯添燃气(831010)融资买入1 84万元,融资偿还0 13万元,融

  • 博言博语 | 在复杂的物理定律中探寻梦想,他是UCSB的“天才”少年

    2023申请季博言博语No 6Kevin加州大学圣芭芭拉分校、尔湾分校、戴维斯

  • 刚刚,云南楚雄州双柏县发生4.4级地震!网友:昆明有震感

    据“中国地震台网”微信公众号的消息,据中国地震台网正式测定,8月13

  • 安排了,建德人工增雨,就在……

    安排了,建德人工增雨,就在……杭州网发布时间:2023-08-1317:22热热

  • 摄影师偶然拍到“红色精灵”闪电:画面壮观

    8月13日消息,广东梅州一名摄影师拍到罕见粉色烟花状闪电,镜头下云层

  • 《天官赐福》遭联合举报,理由非常奇葩!求大家放过国产动画吧

    【动漫杂谈】关于外包:《天官赐福》动画近期名声不太好,第九集部分作

  • 利率可到4%,部分银行买大额存单需“配货”,这类存款也火了

    利率可到4%,部分银行买大额存单需“配货”,这类存款也火了,利率可到4

  • 中国驻罗马尼亚使馆提醒中国公民注意旅游安全

    8月2日,据中国驻罗马尼亚大使馆网站消息,近期赴罗马尼亚中国游客数量

  • 家庭保险保障科技平台轻松集团轻松筹助力《交换人生》,打造欢笑家庭故事

    家庭保险保障科技平台轻松集团轻松筹助力《交换人生》,打造欢笑家庭故

  • 中牟县检察院:“八一”慰问送温暖 拥军优属情谊深

    大河网讯7月31日,中牟县检察院组织开展了庆“八一”走访慰问活动,全

  • 恒生指数收跌2.47% 互联网科技股集体下挫

    香港恒生指数周三低开低走收跌2 47%,报19517 38点。恒生科技指数跌3 2

  • 国有土地使用权的出让年限

    国有土地使用权的出让年限规定是居住用地70年,教育、科技、文化、卫生

  • 用扭力梁的车型(还有什么车用扭力梁?)

    相信大家对用扭力梁的车型,还有什么车用扭力梁?的问题都很疑惑,这个

  • 连续第六年,这家“爱心补给站”坚持公益不间断

    自2018年首次启动“爱心补给站”以来,WiFi万能钥匙连续6年,在高温袭

  • 铜仁市房地产业发展情况汇报会召开

    铜仁市房地产业发展情况汇报会召开,住房,铜仁市,房地产企业,城乡建设局

  • 《剑啸九州》队友们的坚实盾牌!“天罡”帅气登场!

    在新服【龙吟苍海】开启后,许多玩家可能会面对自身防御力不足,无法抵

  • 旅游
    • 天津适合带孩子玩的地方

    • 中国“医疗特区”博鳌乐城形成多样互补型医疗产业格局

    • 好酒也怕巷子深?赛道试驾东风标致新508L

    • 腾讯视频上线“板凳单元” 打造“午间专供”喜剧