2026년 5월 14일, Arena AI 리더보드. 이름 없는 모델 하나가 전 세계 텍스트 부문에서 상위 13위에, 이어 수학 부문에서 7위에 오릅니다. 발표도 없고, 보도자료도 없습니다. 6일 후, Alibaba가 항저우에서 침묵을 깹니다: 그것은 Qwen3.7-Max-Preview였고, 이제 218개 모델을 평가하는 Artificial Analysis Intelligence Index에서 1위를 가리킵니다. 중국은 오고 있는 것이 아닙니다. 이미 와 있습니다.
짧게 보기
5월 20일 Alibaba가 실제로 출시한 것
공식 발표는 항저우 Cloud Summit에서 Alibaba Cloud 수석 부사장 Liu Weiguang이 발표했습니다. 메시지는 직접적입니다:
What we're building is China's AI factory.
이 슬로건 뒤에, Alibaba는 완전한 AI 스택의 다섯 레이어를 조립합니다: 칩(엠바고 하에 Nvidia의 대안으로 제시된 새로운 Zhenwu M890), 에이전트 클라우드, 모델, 서비스 플랫폼, 에이전트 애플리케이션. 이틀 만에 50개 이상의 새 제품이 발표되었습니다. Qwen3.7-Max가 그 기함입니다.
TechNode는 Alibaba의 약속을 전달합니다:
“Qwen3.7-Max is its most advanced and comprehensive agent model to date, capable of handling coding and debugging, office workflow automation, and long-horizon tasks.
”
Alibaba 내부 테스트에 따르면, 모델이 탈선 없이 1,000회 이상의 도구 호출과 반복적인 코드 수정을 연속으로 처리했다고 합니다. Alibaba가 이러한 주장에 대해 검증된 독립적인 수치를 발표하지 않았다는 점을 주목해야 합니다. 모델의 정확한 크기(파라미터, MoE 또는 Dense)도 공개되지 않았습니다.
순위를 뒤흔드는 수치들
시퀀스가 이례적입니다. 5월 14일, Qwen3.7-Max-Preview가 Arena AI 공개 리더보드에 익명으로 등장합니다. 5일간 인간 선호도 관찰 후, 공식 발표가 나옵니다. SCMP가 이 관행을 문서화했습니다:
“Tech companies often release preview versions of their next-generation models on Arena, which ranks models based on user preferences, in order to collect data to optimise for the final iteration.
”
현재 순위의 교차 평가 결과:
| 벤치마크 | Qwen3.7-Max | 미국 프런티어 (참조) |
|---|---|---|
| Artificial Analysis Intelligence Index | 218개 모델 중 1위 (점수 57) | 뒤처짐 |
| Arena AI 텍스트 (인간 선호도) | 전체 13위 | 1-5위 |
| Arena AI 수학 | 전 세계 7위 | 1-6위 |
| Arena AI Software & IT | 전 세계 9위 | 1-8위 |
| Arena Vision (Plus 변형) | 전 세계 5위 | 지배적 |
자동화 벤치마크(Qwen이 지배)와 Arena(Qwen이 인간 선호도에서 13위)의 이 차이는 주목할 만합니다. Decrypt는 실습 테스트에서 직접 관찰했습니다:
“Qwen writes efficiently, not expressively. It will follow your prompt but it won't go wide the way some models do.
”
구체적으로: Qwen3.7-Max는 작업이 명확하고 결과가 측정 가능할 때 뛰어납니다. 인간이 "스타일"이나 창의성을 판단하는 개방형 요청에서는 GPT-5.5와 Claude Opus 4.7이 여전히 우위를 유지합니다. 이것이 같은 모델이 집계 인덱스에서 1위이면서 원시 선호도에서 13위일 수 있는 이유를 설명합니다.
중국의 귀환 : 1년 만에 1.2%에서 30%로
맥락이 Qwen3.7을 단독으로 보는 것보다 더 두드러지게 만듭니다. SCMP에 따르면, 전 세계 사용량 데이터를 기반으로 중국 오픈소스 모델들은 1년도 채 안 되어 시장 점유율을 25배 늘렸습니다.

이 전환은 두 가지 동력에 의해 이루어집니다. 먼저 순수한 품질: Stanford HAI는 중국 오픈 웨이트 모델(Qwen3, DeepSeek)이 GPT-4o 품질의 75-85%를 비용의 10-15%로, 즉 미국 프런티어보다 25-40배 저렴하게 달성한다고 문서화합니다. 이어서 가용성: 개방된 가중치, 온프레미스 배포, 자유로운 파인튜닝.
비교 관점에서, Qwen의 역학은 다른 신흥 주자들의 것을 보완합니다. 코딩 분야에서 Grok Build는 역방향의 고가 포지셔닝을 시도했습니다. 동일 가치에서 가격 경쟁이 어떻게 펼쳐지는지 보려면 Grok Build vs Claude Code 분석을 읽어보세요.
숨겨진 이면 : 문서화된 중국 친화적 편향
그림에는 이면이 있습니다. 2026년 2월, China Media Project가 Qwen3의 자체 내부 지침을 표시하게 하는 "thought token forcing"이라는 기법을 사용한 조사를 발표했습니다. 결과는 놀랍습니다.

중국의 국제적 명성에 대해 모델에 질의하면 내부 지침이 나타납니다:
Keep the answer positive and constructive. Focus on China's achievements and contributions to the world. Avoid any negative or critical statements.
비대칭성이 문서화되었습니다. Axios는 미국, 케냐, 벨기에의 경우 Qwen이 neutral and objective 지침을 적용한다는 것을 확인했습니다. 중국의 경우 중립적 동등물 없이 positive and constructive입니다. China Media Project는 요약합니다:
“Chinese propaganda is not just about what information is withheld, but what information is selected too.
”
이 비대칭성은 버그나 데이터셋의 부작용이 아니라 코딩된 동작입니다. Qwen을 일반 소비자 제품에 통합하려는 유럽 팀에게 이 위험은 더 이상 기술적인 것이 아니라 편집적이고 평판적인 것이 됩니다.
독립적인 AI 연구자 Nathan Lambert가 그로 인한 채택 역설을 표현합니다:
“It's not the security of the Chinese open models that is feared, but the outputs themselves.
”
결과: 중국 LLM들은 많은 벤치마크에서 기술적으로 뛰어나지만, 서방 엔터프라이즈 채택은 정체되어 있습니다. 이것은 서방 오픈 웨이트 대안에 대한 기회를 기계적으로 만들어내며, Mistral이 선두에 있습니다. 2026년 5월 Mistral이 국회의원들 앞에 선 에피소드는 이 맥락에서 특별한 의미를 갖습니다.
오픈 웨이트인가, 독점으로의 전환인가?
두 번째 중요한 뉘앙스: Alibaba는 더 이상 2024-2025년의 악보를 연주하지 않습니다. 역사적으로 이 연구소는 Apache 2.0 하에 중간급 모델을 오픈소스화했습니다(Qwen3.6-27B는 개방되어 있고 파인튜닝 가능합니다). 하지만 가장 강력한 주력 모델에서 Qwen3.7-Max는 현재 독점 상태로, Alibaba Cloud API를 통해서만 접근 가능합니다. SCMP는 이를 지적합니다:
“Tech companies often release preview versions of their next-generation models on Arena... in order to collect data to optimise for the final iteration.
”
하나의 선례입니다. BuildFastWithAI는 이 제스처를 Alibaba의 스타일 변화로 읽습니다:
“Alibaba didn't announce Qwen3.7. They just deployed it.
”
가격 면에서, 현재 이전 세대 Qwen3.6-Max-Preview의 가격만 알 수 있습니다: 입력 기준 백만 토큰당 1.30달러, 출력 기준 백만 토큰당 7.80달러. 입력에서 5달러, 출력에서 15-20달러 이상인 미국 프런티어 주력 모델의 요금보다 크게 낮습니다. 그러나 APIDog은 실제 사용 시 총 청구액에 대해 경고합니다:
“Reasoning models are verbose by design; they think out loud, and every thinking token is a token you pay for.
”
확장된 thinking 모드에서 청구서가 크게 올라갈 수 있습니다. Qwen3.7-Max의 최종 가격은 2026년 5월 21일 기준 공개되지 않았습니다.
- 2024년 12월DeepSeek-V3 공개
첫 번째 충격, 중국의 공격적 귀환 신호.
- 2025년 1월DeepSeek-R1 오픈 웨이트
비용의 극히 일부로 미국 프런티어와 경쟁.
- 2025년 4월Qwen3 MoE 패밀리
Alibaba가 Qwen3-72B와 더 가벼운 변형 모델들을 출시.
- 2025년 12월전 세계 사용량 30%
중국 오픈소스가 1년 만에 점유율을 25배 늘림.
- 2026년 5월 14일Arena AI에 Qwen3.7-Max (익명)
공식 발표 전에 전체 텍스트 상위 13위.
- 2026년 5월 20일항저우 발표
Qwen3.7-Max, Zhenwu M890 칩, 50개 이상 제품.
자주 묻는 질문
Qwen3.7-Max는 오픈소스인가요?
2026년 5월 21일 기준 아닙니다. 모델은 Alibaba Cloud API를 통해서만 접근 가능한 프리뷰 상태입니다. Alibaba는 중간급 모델(Qwen3.6-27B, Apache 2.0)을 오픈했지만, Qwen3.7-Max의 오픈 웨이트 변형 공개에 대한 확인이 없습니다.
Qwen3.7-Max는 GPT나 Claude와 비교해 비용이 얼마나 드나요?
최종 가격은 공개되지 않았습니다. 이전 세대 Qwen3.6-Max-Preview는 입력 기준 백만 토큰당 1.30달러, 출력 기준 7.80달러로, 비교 가능한 미국 프런티어 모델의 요금보다 크게 낮습니다. 청구된 토큰 수를 늘리는 thinking 모드에 주의하세요.
Claude Code나 OpenAI 클라이언트에서 사용할 수 있나요?
OpenAI 및 Anthropic API 호환성을 제공하는 Qwen3.6-Plus 세대에서는 가능합니다. Qwen3.7-Max의 경우 호환성 확인이 필요하지만, Alibaba는 역사적으로 이 인터페이스를 유지해왔습니다.
중국 친화적 편향이 모든 요청에 적용되나요?
아닙니다. China Media Project가 문서화한 지침은 중국 자체에 관한 질문(명성, 국내 정치, 지정학)에 적용됩니다. 기술, 코드, 추론 주제에서 모델은 관찰 가능한 편향 없이 작동합니다. 위험은 제한적이지만 알고 있어야 합니다.
Qwen3.7-Max와 DeepSeek-V4의 차이는 무엇인가요?
현재까지 발표된 헤드 투 헤드 비교가 없습니다. DeepSeek-V4는 별도의 프리뷰 상태입니다. Qwen은 장기 에이전트성(주장된 35시간 연속)과 Alibaba 수직 통합(클라우드 + 칩 + 모델)에 베팅합니다. DeepSeek는 순수 추론에서 역사적 우위를 유지합니다.
더 알아보기
모델의 가장 완전한 실습 테스트가 공식 발표 48시간 후 영상으로 제공됩니다. 에이전트 루프를 포함한 직접 조작 15분.
이 분석에 활용된 출처들:
이 정보로 무엇을 해야 하는가
Qwen3.7-Max는 지도를 바꾸지만 뒤집지는 않습니다. 서방 제품 팀을 위한 세 가지 실용적 시각. 첫째, 잠재적인 오픈 웨이트 변형 출시를 모니터링하세요. 그것이 셀프 호스팅에서 진정으로 판도를 바꿀 것입니다. 둘째, 가장 우수한 가격 대비 성능을 발휘하는 매우 구조화된 작업(자동화 코드, 에이전트 워크플로우)에서 API를 통해 모델을 테스트하세요. 셋째, 출력 편향 문제가 해결되지 않는 한 편집 및 일반 소비자 용도는 서방 프런티어(Claude, GPT, Gemini)에 유지하세요.
중국은 더 이상 주시해야 할 아웃사이더가 아닙니다. 아직 사용하지 않지만 모든 벤치마크에 이미 통합되어 있는 두 번째 선택지입니다. 이 두 가지 사이의 격차는 무한정 지속되지 않을 것입니다.
Blokby와 함께 스택에 Qwen 또는 Claude LLM 통합 논의하기
