全国
    腾讯混元 DiT 文生图大模型开源 6G 小显存版本,一同开源打标模型|腾讯|开发者|it之家
    发布时间:2024-07-05 10:16:29 次浏览
    • 微信: 
      点击复制

      电话联系TA

      -久久信息网

久久信息网提醒您: 发帖时请做好对应地区发布内容,禁止发布违法违规信息,违者封禁账号,本网页提供的文字图片等信息都由网友投稿,有任何疑问联系站长QQ:363930193 。
  • 内容信息
▲ 混元 Captioner 对描述进行结构化与准确度提升混元

Captioner 模型号称针对文生图场景专门进行优化:

  • 构建了结构化的描述体系;

  • 在模型层面,通过注入人工标注、模型输出、公开数据等多种来源提升 Caption 描述的完整性;

  • 注入知名文学作品形象、地标、食物、动物、中国元素与知识等背景知识。

▲ Capiton 模型的背景知识更好,能够识别宫保鸡丁
▲ Captioner 模型结构化描述体系

IT之家附腾讯混元开源文生图大模型相关链接:

  • 官:https://dit.hunyuan.tencent.com/

  • 代码:https://github.com/Tencent/HunyuanDiT

  • 模型:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

  • 论文:https://tencent.github.io/HunyuanDiT/asset/HunyuanDiTTechReport05140553.pdf

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

  • 您可能感兴趣