实体
voice
voice
PulseAugur coverage of voice — every cluster mentioning voice across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
Vision Transformers improved with selective token interaction
研究人员发现了一种称为“语义扩散”的现象,该现象会随着时间的推移降低 Vision Transformers (ViTs) 在密集预测任务中的性能。当全局语义信息不恰当地通过 patch tokens 扩散时会发生这种情况。为了解决这个问题,该研究提出使用稀疏注意力机制,特别是 entmax-1.5,使 token 交互更具选择性。这一改进显著提高了在 VOC、ADE20K 和 Cityscapes 等语义分割基准上的性能,同时保持了…
-
人工智能时代将声音转变为知识产权和可注册商标的资产
在人工智能时代,声音正从单纯的身份象征演变为受保护的知识产权形式。这一转变意味着独特的嗓音特征现在可以注册为商标,为未经授权的使用提供法律追索权。在人工智能可以轻易复制声音的时代,这一发展对于保护个人品牌和商业价值至关重要。
-
Voi founders' AI startup Pit raises $16M seed from a16z for enterprise automation
Pit, a new AI startup founded by the co-founders of the European scooter company Voi, has secured $16 million in seed funding led by Andreessen Horowitz (a16z). The Stockholm-based company aims to provide an "AI product…