0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务。
而且它参数量小,本地跑,运行快。
以前的那些nlp任务都可以用这种万金油来微调。
比如文章提取,文章样式整理,数据格式转换,文章校验,快递信息提取等。
你可能会说我为什么不用传统的nlp来干? 主要是现在的llm模型,从训练到部署已经非常的流水线了,不会深度学习的人也能训练一个并部署,这个流水线简单到,真的只需要处理数据集而已。
整个过程你甚至不需要写…。
代码:
为什么MacBook pro不用高刷新率的屏幕?
如何看待国内开源项目的不可持续性?
Rust 的设计缺陷是什么?
男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
我是新手想养鱼,预算不超过200。有什么好的建议或者禁忌吗。?
紧身牛仔裤看起来不正经,真的是这样吗?
为什么家里要用 NAS?家用 NAS 有哪些实际的、接地气的用途?
多个充电宝或电芯品牌的 3C 认证证书被暂停,涉及罗马仕、安克、绿联、倍思、安普瑞斯等,发生了什么?
哪个ai写代码最强?
NAS用什么硬盘最好??
如何看待三峡集团总部搬迁至武汉?
Office 中为何还要保留 Access 数据库?
mysql每天有1千万数据 怎么办?分表吗 有什么好的方案。?
为什么长得漂亮却没什么用?
谁能劝我不要买NAS?
巴基斯坦援助伊朗防空,大家怎么看?
淘宝为什么要提供npm镜像?
鱼缸有没有简单的过滤配置搭配方式?
俄罗斯为什么不用苏57?
在所有动物肉中,哪一种味道最好?
大a下一个牛市多久到来?
我国的军工能力可以实现一天5000枚火箭弹连着炸三个月吗?
从零写一个3D物理引擎难度多大?
J***a 除了 Spring 还有什么?
前端失业后大家都在做什么?
为什么伊朗的防空系统失效了?
前端是不是快没了?
现在程序员真的不好找工作吗?
Linux下监控流量一般使用什么工具?
《甄嬛传》中祺贵人为什么和甄嬛反目?