当前位置: 代码迷 >> 综合 >> 【AI简报20211029期】YOLOv5-Lite 树莓派实时 、超过1000个RISC-V核心的AI芯片
  详细解决方案

【AI简报20211029期】YOLOv5-Lite 树莓派实时 、超过1000个RISC-V核心的AI芯片

热度:33   发布时间:2023-12-21 14:40:07.0

462d1ac14b52671c5c941923ab9a7029.png


嵌入式AI

下一代AI芯片力量集结,年度AI芯片峰会首批重磅嘉宾公布!报名全面开启

原文:

https://www.sohu.com/a/496237981_115978

9e783c7b714446a76a1c3f6beda5f5bd.png

2021年12月1-2日,GTIC 2021全球AI芯片峰会将在北京举办,由智一科技旗下智能产业第一媒体智东西与专注于硬科技的知识分享社区智猩猩联合主办,为期两天。

本届峰会将以“芯潮澎湃 智领未来”为主题,设置四大主题论坛,分别是“AI芯片高峰论坛”、“云端AI芯片专题论坛”、“边缘端AI芯片专题论坛”、“新兴计算技术专题论坛”,将对AI芯片技术革新和落地走向进行全景式解构。(GTIC 2021全球AI芯片峰会启动!12月1日北京见,共飨产业盛宴)

0bf5e20ed779272cd577ada429623a57.png

超过1000个RISC-V核心的AI芯片来了

原文:

https://www.eet-china.com/mp/a84657.html

Esperanto公司由高性能x86微处理器Transmeta创始人Dave Ditzel于2014年创办,完全采用RISC-V架构开发针对数据中心高性能应用和机器学习的微处理器,很多研发人员来自英特尔和原SUN微系统公司。

Espernato创始人Ditzel在今年8月份的Hot Chips 会议上展示了ET-SoC-1 ML推理芯片的细节。该芯片包含1092个定制64位RISC-V微处理器内核,160MB片上SRAM,以及配套I/O端口——所有这些都集成在一个7nm芯片上。

顾名思义,ET-SoC-1 ML推理芯片旨在为ML推理工作负载提供优越性能/功耗。为了做到这一点,它采用了经济的电路逻辑设计以及专业的低压电源设计技术。

2347466502d871eb672393b1f813da76.png

再改YOLO | YOLO-ReT让边缘端也可以实时检测

原文:

https://mp.weixin.qq.com/s/CNw54q-fFHNwlekkOuKpdA

33cddc1b186ab262fd7817aae4e99f27.png

目标检测模型的性能在模型精度和效率两个主要方面得到了快速的发展。然而,为了将基于深度神经网络(DNN)的目标检测模型部署到边缘设备,通常需要对模型进行比较大的压缩,但是与之而来的也降低了模型的准确性。

在本文中,作者根据现有先进方法中各种特征尺度之间缺少的组合连接的问题,提出了一种新的边缘GPU友好模块,用于多尺度特征交互。此外,作者提出了一种新的迁移学习backbone采用的灵感是来自不同任务的转换信息流的变化,旨在补充特征交互模块,并提高准确性和推理速度的各种边缘GPU设备上的可用性。

YOLOv5-Lite 树莓派实时 | 更少的参数、更高的精度、更快的检测速度(C++部署分享)

原文:

https://mp.weixin.qq.com/s/8bHn_zBzK8124lImB7lZwA

d2cbf4ed17d8a64fa2de38b886c90f8d.png

YOLOv5-Lite的网络结构的Backbone主要使用的是含Shuffle channel的Shuffle block组成;

检测 Head 依旧用的是 YOLOv5 head,但用的是其简化版的 YOLOv5 head

Shuffle block示意图如下:

bc516761a7737465750de85f9e5abc1e.png


AI热点

归一化提高预训练、缓解梯度不匹配,Facebook的模型超越GPT-3

原文:

https://www.jiqizhixin.com/articles/2021-10-27-7

来自 Facebook AI 的研究者提出了 NormFormer,该模型能够更快地达到目标预训练的困惑度,更好地实现预训练困惑度和下游任务性能。

在原始的 Transformer 架构中,LayerNorm 通常在 Residual 之后,称之为 Post-LN(Post-Layer Normalization)Transformer,该模型已经在机器翻译、文本分类等诸多自然语言的任务中表现突出。

a1bba76cbbf5d8ef18873dc4153001f4.png

论文地址:https://arxiv.org/pdf/2110.09456.pdf

Swin-Transformer再次助力夺冠 | Kaggle第1名方案解读

原文: 

https://mp.weixin.qq.com/s/1zwqM2LTB0eCD9DSoyf0jQ

20ecaa2ad4789512c6dfc158a25b34cb.png

在报告中介绍了two-step “detect-then-match”的视频实例分割方法。第1步对每一帧进行实例分割得到大量的instance mask proposals。第2步是利用光流进行帧间instance mask matching。用high quality mask proposals证明了一个简单的匹配机制可以促使得到更好的跟踪。本文的方法在2021年UVO比赛中取得了第1名的成绩。

速度提升2倍,超强悍CPU级骨干网络PP-LCNet出世!

原文:

https://mp.weixin.qq.com/s/wT-65cs_s7RPkHlUPI-KAg

算法速度优化遇到瓶颈,达不到要求?应用环境没有高性能硬件只有CPU?

是不是直接戳中了各位开发者的痛点!莫慌,今天小编就来为万千开发者破局~

这个破局点就是:针对CPU设备及加速库MKLDNN定制的骨干网络PP-LCNet!

空口无凭,上图为证!

7fef8e57e1a4837f4e4987ef01fd1f41.png

NeurIPS2021|鱼和熊掌不可兼得?清华团队提出高准确率的可解释分类模型

原文:

https://www.jiqizhixin.com/articles/2021-10-29-2

RRL的提出,不仅使得可解释规则模型能够适用于更大的数据规模和更广的应用场景,还为从业人员提供了一个更好的在模型复杂度和分类效果之间权衡的方式。

现有的机器学习分类模型从性能和可解释性两个维度大致分为两类:以深度学习和集成学习(如随机森林、XGBoost)为代表的分类模型具有良好的分类性能,但模型复杂度高、可解释性差,而以决策树和逻辑回归为代表的模型可解释性强,但分类性能不理想。

27ae776707ce64f4bd1c3464772d43fd.png

论文链接:https://arxiv.org/abs/2109.15103

代码链接:https://github.com/12wang3/rrl

251f8d50db46979ef3ef65af652eff97.png

你可以添加微信17775982065为好友,注明:公司+姓名,拉进RT-Thread官方微信交流群!

bcef3f3151b99ffacff341127a0b4eb1.gif

? 点击阅读原文进入官网

  相关解决方案