Vision Transformer(ViT)是一种用于计算机视觉任务的模型,它采用了什么方法来处理图像数据? A、卷积神经网络B、循环神经网络C、注意力机制D、支持向量机 发布时间:2025-06-05 19:48:31