会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 加速替代CUDA!摩尔线程开源vLLM!

加速替代CUDA!摩尔线程开源vLLM

时间:2024-12-26 19:54:49 来源:群起效尤网 作者:综合 阅读:753次

11月5日消息,加速近日,替代摩尔线程上线了大语言模型高速推理框架开源项目vLLM的线程MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的开源范例。

摩尔线程表示,加速正努力围绕自主研发的替代统一系统架构GPU、MUSA软件平台,线程构建完善好用的开源MUSA应用生态。 

加速替代CUDA!摩尔线程开源vLLM

vLLM是加速一个高效且易用的大模型推理和服务框架,支持创新的替代PagedAttention内存管理、连续批处理请求、线程CUDA/HIP图的开源快速模型执行、CUDA核心优化、加速分布式推理支持等,替代可显著提高大语言模型(LLM)的线程推理性能。

目前,vLLM已在各种大语言模型中得到广泛应用,成为业界常用的开源大模型推理框架。

摩尔线程基于vLLM v0.4.2版本,进行了移植适配,使之支持摩尔线程GPU后端Device,并完全开源,开发者可以二次开发、升级vLLM到社区更新版本等。

值得一提的是,得益于摩尔线程MUSA架构的先进性、软件栈对CUDA的优良兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码迁移到MUSA平台,实现替代。

同时,CUDA相关库的调用,也可以快速替换为相应的MUSA加速库,如算子库muDNN、集合通信库MCCL、线性代数库muBLAS等。

摩尔线程通过MUSA软件栈对CUDA软件栈接口兼容,大幅提升了应用移植的效率,缩短了开发周期,还提供MUSIFY自动代码移植工具等一系列实用工具和脚本。

摩尔线程vLLM-MUSA开源地址:

https://github.com/MooreThreads/vLLM_musa

(责任编辑:焦点)

相关内容
  • 标晚谈萨卡缺阵:阿森纳可让马丁内利移到右路,或冬窗寻求补强
  • 记者:尽管在新帅阿莫林麾下表现有所进步,但曼联依旧想卖安东尼
  • 《夜勤人》续作《夜勤人2:无尽宝库》Steam页面上线 明年发售
  • 《夜勤人》续作《夜勤人2:无尽宝库》Steam页面上线 明年发售
  • 九州风神推出FL12R系列机箱反叶风扇:配备36颗第二代ARGB灯珠
  • 科幻恐怖第一人称射击游戏《最深的恐惧》Steam页面上线 支持中文
  • 老友相见!本泽马:很高兴见到C罗,我们祝愿彼此未来好运
  • AMD苏姿丰预言AI芯片每年60%爆发增长!2028年将达5000亿美元规模
推荐内容
  • 不怪人家只切4am  切一个视频爆一个
  • 蚂蚁集团宣布换帅!韩歆毅接任CEO 井贤栋专注董事长工作
  • [流言板]沃西谈詹姆斯:你不能要求一个40岁的球员每晚都发挥出色
  • [流言板]对阵凯尔特人斯马特出战成疑,交易后还未在绿军主场登场
  • [流言板]马刺近期遭遇两连败,目前战绩15胜15负落后勇士1个胜场
  • 图拉姆:我会听取劳塔罗和阿瑙的经验,他们帮助我不断进步