Quay lại bảng xếp hạng
Claude Sonnet 4.6 logo

Claude Sonnet 4.6

Anthropic

Claude Sonnet 4.6 (Non-reasoning, High Effort) là một trong những mô hình trí tuệ hàng đầu, hỗ trợ đầu vào văn bản và hình ảnh để tạo ra văn bản. Mô hình này sở hữu khả năng thông minh vượt trội. Mặc dù vậy, nó được đánh giá là khá đắt và có tốc độ chậm hơn mức trung bình so với các mô hình phi lý luận khác trong cùng phân khúc giá.

Đánh giá model này

Đánh giá của bạn: Chưa đánh giá

Thông số mô hình

Thông tin kỹ thuật và phiên bản được phát hành.

Nhà phát triển

Anthropic

Hỗ trợ đa phương thức

Không

Chỉ số thông minh

45

Độ dài ngữ cảnh (Context window)

200k

Giá trung bình (USD/1M token)

$6.00

Tốc độ (token/s)

46.0

Độ trễ (s)

0.90

Ngày phát hành

17/2/2026

Thống kê hiệu suất

Chỉ số thông minh của model sẽ được tính trung bình của các điểm benchmark này

Điểm chuẩn chi tiết

So sánh Claude Sonnet 4.6 với các mô hình hàng đầu khác trong các lĩnh vực cụ thể.

Các mô hình khác từ Anthropic

Claude 4.5 Haiku (Thinking) của Anthropic là một trong những model mạnh về khả năng thông minh và có mức giá hợp lý khi so sánh với các model cùng loại. Model này cũng nổi bật về tốc độ, hỗ trợ đầu vào văn bản và hình ảnh, đầu ra văn bản, và có cửa sổ ngữ cảnh 200k token với kiến thức cập nhật đến tháng 7 năm 2025.

Claude Sonnet 4.5 là mô hình Sonnet tiên tiến nhất của Anthropic, được tối ưu hóa cho các tác nhân AI và quy trình mã hóa. Nó mang lại hiệu suất vượt trội trên các điểm chuẩn mã hóa và giới thiệu các khả năng tác nhân mạnh mẽ như điều phối công cụ và thực thi song song suy đoán. Mô hình này phù hợp cho các quy trình làm việc đa ngữ cảnh và dài hạn, có khả năng hoạt động tự chủ trong nhiều giờ.

Claude Fable 5 (Adaptive Reasoning, Max Effort) là một trong những mô hình AI cực kì mạnh mẽ, được xem như phiên bản an toàn hóa của Mythos 5. Nó nổi bật với khả năng lý luận thích ứng và nỗ lực tối đa, đặc biệt khi dùng Max effort thì Anthropic có cài đặt cơ chế lại Opus 4.8 nhưng giá thì rất cao với 12.5$/1 M token đầu vào (cache 1$/1M token) và 50$/1 M token đầu ra.

Claude Opus 4.6 (Non-thinking) đây là phiên bản mặc định high effort cũng đã là một trong những mô hình hàng đầu khả năng suy nghĩ còn phiên bản low effort thì suy nghĩ ít đi nhưng thể hiện không khác biệt nhiều. Mặc dù có chi phí cao, nó cung cấp khả năng xử lý đầu vào đa phương thức bao gồm văn bản và hình ảnh, đồng thời tạo ra đầu ra văn bản chất lượng. Điểm nổi bật là cửa sổ ngữ cảnh có thể mở rộng lên 1 triệu token, cho phép xử lý lượng lớn thông tin.

Claude Opus 4.6 (Thinking) là một trong những mô hình tập trung chủ yếu và Adaptive Thinking (suy nghĩ thích ứng). Mặc dù đắt đỏ, chậm và dài dòng, nó nổi bật với khả năng lý luận thích ứng. Mô hình này hỗ trợ đầu vào văn bản và hình ảnh, sau đó xuất ra văn bản.

Claude Opus 4.7 (Non-reasoning, High Effort) là một trong những mô hình tốt nhất của Anthropic , mặc dù đã giảm suy luận, nhưng khi bật high effort mô hình vẫn rất mạnh. Nó hỗ trợ đầu vào văn bản và hình ảnh, với đầu ra văn bản. Tuy nhiên, mô hình này khá đắt đỏ, chậm hơn mức trung bình và có xu hướng overthinking.

Bài viết liên quan

Claude nâng cấp 1 triệu token context window miễn phí

Claude nâng cấp 1 triệu token context window miễn phí

Trong một động thái được đánh giá là 'lật ngược bàn cờ' trong ngành công nghiệp AI, Anthropic vừa công bố một nâng cấp mang tính cách mạng: cung cấp 1 triệu token context window cho các phiên bản Claude Opus 4.6 và Sonnet 4.6 với mức giá tiêu chuẩn. Điều đáng nói là không hề có bất kỳ phụ phí nào cho ngữ cảnh dài, một chính sách hoàn toàn đối lập với hầu hết các nhà cung cấp AI khác, bao gồm cả Google và OpenAI, những người thường tăng giá theo giới hạn ngữ cảnh.Claude với một triệu token context window có giá bao nhiêu?Đây là điểm thay đổi cực lớn mà Anthropic mang lại. Một triệu token tương đương với khoảng 750.000 từ, đủ để xử lý 10 đến 15 cuốn tiểu thuyết đầy đủ chỉ trong một lần. Con số này có ý nghĩa to lớn trong các tình huống làm việc thực tế:Thay vì phải chia nhỏ codebase hay tài liệu thành từng phần, người dùng có thể đưa toàn bộ dự án vào một phiên làm việc duy nhất, giúp AI làm việc với nó như một khối thống nhất.Claude có thể giữ nguyên toàn bộ thông tin từ đầu đến cuối khi phân tích hàng nghìn trang hợp đồng pháp lý, loại bỏ nguy cơ mất ngữ cảnh giữa chừng.Các kỹ thuật xử lý ngữ cảnh dài phức tạp trước đây như chia nhỏ tài liệu, tóm tắt có mất mát hoặc xóa context giữa chừng để giải phóng bộ nhớ, giờ đây đều không còn cần thiết.Cấu trúc giá mới không phụ phí ở một triệu tokenĐiều làm ngạc nhiên nhất là cấu trúc giá mới hoàn toàn không có phụ phí cho ngữ cảnh dài. Mức giá tiêu chuẩn được áp dụng cho toàn bộ từ 1 đến 1 triệu token:Opus 4.6: 5$ đầu vào và 25$ đầu ra mỗi 1 triệu token.Sonnet 4.6: 3 $ la đầu vào và 15 $ đầu ra mỗi 1 triệu token.Để dễ hình dung, trước đây, khi sử dụng context window vượt quá 200.000 token, nhiều nhà cung cấp thường tính thêm phụ phí từ 2 đến 4 lần. Đặc biệt, người dùng Claude Code với các gói Pro (20 $), Max (100 $), Team và Enterprise đều tự động nhận được 1 triệu token context window khi sử dụng Opus 4.6 mà không cần thêm tín dụng sử dụng.Claude Opus 4.6 có thực sự nhớ hết 1 triệu token không?Một câu hỏi thường gặp khi tăng kích thước context window là liệu chất lượng suy luận có bị ảnh hưởng. Anthropic đã giải đáp mối lo ngại này bằng các kết quả benchmark ấn tượng.Claude Opus 4.6 đạt 78,3% trên MRCR v2 – một bài đo khả năng tìm lại thông tin ẩn trong lượng văn bản khổng lồ. Đây là mức cao nhất so với tất cả các model tiên tiến hiện tại ở cùng độ dài ngữ cảnh. Để so sánh:Độ chính xác của GPT giảm đáng kể, chỉ đạt 36% ở 1 triệu context.Gemini thậm chí còn thể hiện kém hơn, chỉ ở mức 26%, cho thấy các mô hình này đã "quên" đến ⅓ những gì đã được cung cấp trước đó khi đạt đến ngữ cảnh dài.Với Sonnet 4.6, khả năng ghi nhớ hơn ⅔ ngữ cảnh dài càng chứng tỏ vị thế dẫn đầu của Anthropic trong việc xử lý thông tin phức tạp. Giới hạn media của Claude tăng gấp 6 lần lên 600 ảnh mỗi requestBên cạnh context window, một nâng cấp khác tuy ít được chú ý nhưng lại vô cùng quan trọng là giới hạn media. Giới hạn này đã tăng lên 600 ảnh hoặc trang PDF mỗi request, gấp 6 lần so với mức 100 trước đó. Điều này đặc biệt có ý nghĩa với những người làm việc chuyên sâu với các tác vụ yêu cầu xử lý nhiều tài liệu trực quan hoặc PDF, điều này thực sự có ý nghĩa đối với những người dùng gói Pro, Max của Claude cứ chạm token limit liên tục và lại tiếp tục phải chờ.Giảm đáng kể chi phí sử dụng cho doanh nghiệpTính năng đột phá này có sẵn ngay trên Claude Platform, Microsoft Azure Foundry và Google Cloud Vertex AI. Đối với người dùng Claude Code trên các gói Max, Team và Enterprise sử dụng Opus 4.6 thì 1 triệu token context window đã được bật mặc định mà không cần cài đặt thêm. Điều này không chỉ nâng cao hiệu suất mà còn làm giảm đáng kể chi phí cho các hệ thống AI thường xuyên gọi API của Claude, mang lại lợi ích kinh tế lớn cho các doanh nghiệp và nhà phát triển.

Li
Liên
16 thg 3, 2026