header_user_avatar
登录
  • 首页
  • 云盘
  • 状态
  • 隐私政策
  • 联系我们

过拟合问题

post_img
发布于 2024-12-26
369 热度 无~ 大模型

deepseek v3存在过拟合问题,并且有概率输出“由OpenAI开发,基于GPT-4架构”

AI 摘要

输出情况 参数设定 输出情况 参数设定 结论 deepseek V3性能的确有所提升,但使用685B参数,256位专家的框架,每个 …

loading_svg

Copyright © 2024 by Sereniblue All Rights Reserved.


Theme Sakurairo by Fuukei
m-avatar
  • 首页
  • 云盘
  • 状态
  • 隐私政策
  • 联系我们
浙ICP备2024056246号