矢量数据库开始开发类似SQL的接口,并支持多模态。
该方法的贡献包括:
我认为升级到GPT-4可能会有所帮助,虽然它确实提供了略微改进的结果,但仍然无法创建一个完全功能的应用程序。因此,虽然GPT-engineer显示出一些希望,但可以说它还不能完全处理严肃的编码任务。
LLaVA是一个端到端训练的多模态大模型,它将视觉编码器和用于通用视觉和语言理解的Vicuna相结合,具备令人印象深刻的聊天能力。而CogAgent是在CogVLM基础上改进的开源视觉语言模型,拥有110亿个视觉参数和70亿个语言参数。
重新定义业务运营: