Qwen: Qwen VL Plus

QwenID: qwen/qwen-vl-plus

Qwen's Enhanced Large Visual Language Model. Significantly upgraded for detailed recognition capabilities and text recognition abilities, supporting ultra-high pixel resolutions up to millions of pixels and extreme aspect ratios for image input. It delivers significant performance across a broad range of visual tasks.

Pricing per 1M Tokens

Input (Prompt)	$0.14
Output (Completion)	$0.41
Cache Read	$0.03
Cache Write	Free
Image	N/A

Specifications

Context Length	131K
Max Output Tokens	8K
Input Modalities	Text + Image
Output Modalities	Text
Tokenizer	Qwen
Instruct Type	N/A
Top Provider Context	131K
Top Provider Max Output	8K
Moderated	No