# 通义千问视觉语言模型使用指南
我们使用的是阿里巴巴达摩院开发的通义千问2.5-VL-72B-Instruct多模态大模型,这是一个强大的视觉-语言模型,专为图像理解和分析优化。
## 模型特点
- **高精度视觉理解**:能够精确识别图像中的物体、场景和细节
- **专业领域知识**:包含农业和植物病理学专业知识
- **详细中文描述**:提供丰富、准确的中文分析结果
- **多模态能力**:能同时处理图像输入和文本输入
## 最佳实践
1. **提供清晰图像**:确保病害部位清晰可见,光线充足
2. **多角度拍摄**:对于复杂病症,提供不同角度的照片可提高识别准确率
3. **包含环境信息**:在可能的情况下,包含植物的整体状况和生长环境
## 识别效果
通义千问2.5-VL拥有7200亿参数,是目前最先进的中文多模态模型之一,对中文农业领域的病虫害识别有特别优化,能够提供专业、准确的诊断结果。