GPT-4 识图功能迟迟不凋谢 ,终于有人禁不住自己入手做了一个。
MiniGPT-4 来了 ,Demo 凋谢在线可玩 。
传一张海鲜大餐照片下来 ,就能直接取患上菜谱。
传一张商品下场图 ,就能让 AI 写一篇带货文案 。手绘一个网页 ,可能给出对于应的 HTML 代码
除了花难题拉满,也反对于凭证知识推理图上内容是否公平、批注神色包为甚么可笑 ,以及看截图找片子等娱乐玩法 。可能说,GPT-4 宣告时揭示过的功能,MiniGPT-4 根基也都有了 。
这下网友直接把 Demo 效率器挤爆 ,开拓团队连开 4 台备用效率器 ,都有多少十人在排队 。
除了钻研团队给出的示例,网友也用 MiniGPT-4 玩出了各种花着
有人上传自己画的画 ,让 AI 评估评估。
有人上传一张从车道拍摄的飞机坠毁瞬间,让 MiniGPT-4 尽可能详细地形貌,并思考自动驾驶 AI 能不能清晰这个时事 。
做到这么好的下场 ,MiniGPT-4 实现起来却并不重大。
把图像编码器与开源语言模子 Vicuna(小羊驼)整合起来,而且解冻了两者的大部份参数 ,惟独要磨炼很少一部份 。
传统预磨炼阶段