Claude Opus 4.7
Claude Opus 4.7
Model penalaran hibrida yang mendorong batas kemampuan coding dan agen AI, dengan jendela konteks 1M
Pengumuman
- BARU Claude Opus 4.7 - 16 Apr 2026 - Claude Opus 4.7 menghadirkan kinerja yang lebih kuat dalam coding, penglihatan, dan tugas multi-langkah yang kompleks. Model ini lebih teliti dan konsisten dalam pekerjaan sulit, dengan hasil yang lebih baik di pekerjaan pengetahuan profesional.
- Claude Opus 4.6 - 5 Feb 2026 - Claude Opus 4.6 adalah model paling mampu saat ini. Dibangun di atas kecerdasan Opus 4.5, model ini membawa tingkat keandalan dan presisi baru untuk coding, agen, dan alur kerja perusahaan.
- Claude Opus 4.5 - 24 Nov 2025 - Claude Opus 4.5 adalah model paling cerdas saat ini. Model ini menetapkan standar baru di seluruh coding, agen, penggunaan komputer, dan alur kerja perusahaan. Opus 4.5 merupakan langkah maju yang berarti dalam hal kemampuan sistem AI.
- Claude Opus 4.1 - 5 Agu 2025 - Claude Opus 4.1 adalah pengganti langsung untuk Opus 4 yang memberikan kinerja dan presisi unggul untuk tugas coding dan agen di dunia nyata. Model ini menangani masalah multi-langkah yang kompleks dengan lebih teliti dan perhatian terhadap detail.
- Claude Opus 4 - 22 Mei 2025 - Claude Opus 4 mendorong batas dalam coding, pencarian agen, dan penulisan kreatif. Kami juga memungkinkan untuk menjalankan Claude Code di latar belakang, sehingga pengembang dapat menetapkan tugas coding jangka panjang untuk ditangani oleh Opus secara mandiri.
Ketersediaan dan Harga
Untuk pengguna bisnis dan konsumen yang ingin berkolaborasi dengan model paling kuat kami dalam tugas kompleks, Opus 4.7 tersedia di Claude untuk pengguna Pro, Max, Team, dan Enterprise. Untuk pengembang yang tertarik membangun solusi AI yang membutuhkan kecerdasan terdepan, Opus 4.7 tersedia secara asli di Platform Claude, serta di Amazon Bedrock, Google Cloud Vertex AI, dan Microsoft Foundry. Harga untuk Opus 4.7 mulai dari $5 per juta token input dan $25 per juta token output, dengan penghematan biaya hingga 90% dengan penyimpanan sementara prompt dan penghematan 50% dengan pemrosesan batch. Untuk memulai, gunakan claude-opus-4-7 melalui API Claude. Untuk beban kerja yang perlu dijalankan di AS, inferensi khusus AS tersedia dengan harga 1,1x untuk token input dan output.
Kasus Penggunaan
Opus 4.7 adalah model premium yang bekerja terbaik untuk tugas-tugas yang tidak dapat ditangani model sebelumnya dan di mana kinerja adalah yang terpenting. Model ini dirancang untuk rekayasa perangkat lunak profesional, alur kerja agen yang kompleks, dan tugas perusahaan berisiko tinggi. Dengan pemikiran adaptif, Opus 4.7 secara otomatis menyesuaikan seberapa banyak pemikiran yang digunakan berdasarkan kompleksitas tugas, menghabiskan lebih banyak waktu pada masalah yang lebih sulit dan merespons dengan cepat pada masalah yang lebih sederhana. Kasus penggunaan populer meliputi:
Coding Tingkat Lanjut
Opus 4.7 dapat dengan percaya diri memberikan kode siap produksi dengan pengawasan minimal. Model ini merencanakan dengan hati-hati, berjalan lebih lama dengan usaha berkelanjutan, dan beroperasi secara andal di basis kode yang lebih besar. Model ini menangkap kesalahannya sendiri, sehingga insinyur senior dapat mendelegasikan pekerjaan coding tersulit mereka dengan percaya diri.
Agen AI
Opus 4.7 mendukung alur kerja agen produksi, mengatur tugas multi-alat yang kompleks dengan keandalan yang konsisten. Model ini merencanakan dengan sengaja, menggunakan memori untuk belajar di seluruh sesi, dan mendorong pekerjaan jangka panjang dengan pengawasan minimal.
Alur Kerja Perusahaan
Opus 4.7 menetapkan standar untuk alur kerja perusahaan, membawa konteks di seluruh sesi untuk mengelola proyek multi-hari yang kompleks dari awal hingga akhir dengan polesan profesional dan kinerja kuat pada spreadsheet, slide, dan dokumen.
Benchmark
Claude Opus 4.7 adalah model kami yang paling mampu dan tersedia secara umum, berkinerja di garis depan dalam kemampuan coding, agen, dan pekerjaan pengetahuan.
Kepercayaan dan Keamanan
Pengujian dan evaluasi ekstensif memastikan rilis Opus 4.7 memenuhi standar keamanan, keamanan siber, dan keandalan. Kartu model yang menyertainya mencakup hasil keamanan secara mendalam.
Testimoni Pelanggan
Dalam pengujian awal, kami melihat potensi lompatan signifikan bagi pengembang kami dengan Claude Opus 4.7. Model ini menangkap kesalahan logisnya sendiri selama fase perencanaan dan mempercepat eksekusi, jauh melampaui model Claude sebelumnya. Sebagai platform teknologi keuangan yang melayani jutaan konsumen dan bisnis dalam skala besar, kombinasi kecepatan dan presisi ini bisa menjadi pengubah permainan: mempercepat kecepatan pengembangan untuk pengiriman solusi keuangan tepercaya yang diandalkan pelanggan kami setiap hari.
Anthropic telah menetapkan standar untuk model coding, dan Claude Opus 4.7 mendorongnya lebih jauh dengan cara yang berarti sebagai model tercanggih di pasar. Dalam evaluasi internal kami, model ini menonjol tidak hanya untuk kemampuan mentah, tetapi juga untuk seberapa baik model ini menangani alur kerja async dunia nyata - otomatisasi, CI/CD, dan tugas jangka panjang. Model ini juga berpikir lebih dalam tentang masalah dan membawa perspektif yang lebih berpendapat, bukan sekadar setuju dengan pengguna.
Claude Opus 4.7 adalah model terkuat yang pernah dievaluasi Hex. Model ini melaporkan dengan benar ketika data hilang alih-alih memberikan fallback yang tampak masuk akal tetapi salah, dan menolak jebakan data sumbang yang bahkan Opus 4.6 pun terjebak. Ini adalah Opus 4.6 yang lebih cerdas dan lebih efisien: Opus 4.7 dengan usaha rendah kira-kira setara dengan Opus 4.6 dengan usaha sedang.
Pada benchmark coding 93 tugas kami, Claude Opus 4.7 meningkatkan resolusi sebesar 13% dibandingkan Opus 4.6, termasuk empat tugas yang tidak dapat diselesaikan oleh Opus 4.6 maupun Sonnet 4.6. Ditambah dengan latensi median yang lebih cepat dan kepatuhan instruksi yang ketat, ini sangat berarti untuk alur kerja coding yang kompleks dan berjalan lama. Ini mengurangi gesekan dari tugas multi-langkah sehingga pengembang dapat tetap dalam aliran dan fokus pada pembangunan.
Berdasarkan benchmark agen penelitian internal kami, Claude Opus 4.7 memiliki baseline efisiensi terkuat yang pernah kami lihat untuk pekerjaan multi-langkah. Model ini meraih skor keseluruhan tertinggi di enam modul kami dengan 0,715 dan memberikan kinerja konteks panjang yang paling konsisten dari model mana pun yang kami uji. Pada Keuangan Umum - modul terbesar kami - model ini meningkat secara berarti dibandingkan Opus 4.6, dengan skor 0,813 dibandingkan 0,767, sambil juga menunjukkan pengungkapan dan disiplin data terbaik dalam grup. Dan pada logika deduktif, area di mana Opus 4.6 kesulitan, Opus 4.7 solid.
Claude Opus 4.7 memperluas batas kemampuan model untuk menyelidiki dan menyelesaikan tugas. Anthropic jelas telah mengoptimalkan penalaran berkelanjutan dalam jangka panjang, dan itu terlihat dengan kinerja terdepan di pasar. Saat insinyur beralih dari bekerja 1:1 dengan agen ke mengelolanya secara paralel, ini adalah jenis kemampuan terdepan yang membuka alur kerja baru.
Kami melihat peningkatan besar dalam pemahaman multimodal Claude Opus 4.7, dari membaca struktur kimia hingga menginterpretasikan diagram teknis yang kompleks. Dukungan resolusi yang lebih tinggi membantu Solve Intelligence membangun alat terbaik di kelasnya untuk alur kerja paten ilmu kehidupan, mulai dari drafting dan penuntutan hingga deteksi pelanggaran dan pembuatan bagan ketidakabsahan.
Bagi Replit, Claude Opus 4.7 adalah keputusan upgrade yang mudah. Untuk pekerjaan yang dilakukan pengguna kami setiap hari, kami mengamati bahwa model ini mencapai kualitas yang sama dengan biaya lebih rendah - lebih efisien dan presisi dalam tugas seperti menganalisis log dan jejak, menemukan bug, dan mengusulkan perbaikan. Secara pribadi, saya suka bagaimana model ini mendorong kembali selama diskusi teknis untuk membantu saya membuat keputusan yang lebih baik. Rasanya seperti rekan kerja yang lebih baik.
Claude Opus 4.7 menunjukkan akurasi substantif yang kuat pada BigLaw Bench untuk Harvey, dengan skor 90,9% pada usaha tinggi dengan kalibrasi penalaran yang lebih baik pada tabel review dan penanganan tugas pengeditan dokumen ambigu yang lebih cerdas. Model ini dengan benar membedakan ketentuan penugasan dari ketentuan perubahan kendali, tugas yang secara historis menantang model terdepan. Substansi secara konsisten dinilai sebagai kekuatan di seluruh evaluasi kami: benar, teliti, dan dikutip dengan baik.
Claude Opus 4.7 adalah model coding yang sangat mengesankan, terutama untuk otonomi dan penalaran yang lebih kreatif. Di CursorBench, Opus 4.7 memberikan lompatan berarti dalam kemampuan, melewati 70% dibandingkan Opus 4.6 yang 58%.
Untuk alur kerja multi-langkah yang kompleks, Claude Opus 4.7 adalah langkah naik yang jelas: plus 14% dibandingkan Opus 4.6 dengan token lebih sedikit dan sepertiga kesalahan alat. Ini adalah model pertama yang lolos tes kebutuhan implisit kami, dan terus mengeksekusi melalui kegagalan alat yang sebelumnya menghentikan Opus. Inilah lompatan keandalan yang membuat Notion Agent terasa seperti rekan sejati.
Dalam evaluasi kami, kami melihat lompatan dua digit dalam akurasi panggilan alat dan perencanaan di agen orkestrator inti kami. Saat pengguna memanfaatkan Hebbia untuk merencanakan dan mengeksekusi kasus penggunaan seperti pengambilan, pembuatan slide, atau pembuatan dokumen, Claude Opus 4.7 menunjukkan potensi untuk meningkatkan pengambilan keputusan agen dalam alur kerja ini.
Pada Rakuten-SWE-Bench, Claude Opus 4.7 menyelesaikan 3 kali lebih banyak tugas produksi daripada Opus 4.6, dengan peningkatan dua digit dalam Kualitas Kode dan Kualitas Uji. Ini adalah peningkatan berarti dan upgrade yang jelas untuk pekerjaan rekayasa yang dikirim tim kami setiap hari.
Untuk beban kerja review kode CodeRabbit, Claude Opus 4.7 adalah model paling tajam yang pernah kami uji. Recall meningkat lebih dari 10%, mengungkap beberapa bug paling sulit dideteksi di PR paling kompleks kami, sementara presisi tetap stabil meskipun cakupan meningkat. Model ini sedikit lebih cepat dari GPT-5.4 xhigh di harness kami, dan kami menyiapkannya untuk pekerjaan review terberat kami saat peluncuran.
Untuk Super Agent Genspark, Claude Opus 4.7 memenuhi tiga pembeda produksi yang paling penting: ketahanan loop, konsistensi, dan pemulihan kesalahan yang anggun. Ketahanan loop adalah yang paling kritis. Model yang berulang tanpa batas pada 1 dari 18 kueri membuang komputasi dan memblokir pengguna. Varians yang lebih rendah berarti lebih sedikit kejutan di produksi. Dan Opus 4.7 mencapai rasio kualitas-per-panggilan-alat tertinggi yang pernah kami ukur.
Claude Opus 4.7 adalah langkah naik berarti untuk Warp. Opus 4.6 adalah salah satu model terbaik untuk pengembang, dan model ini secara terukur lebih teliti di atas itu. Model ini lolos tugas Terminal Bench yang gagal oleh model Claude sebelumnya, dan mengerjakan bug konkurensi rumit yang tidak bisa dipecahkan Opus 4.6. Bagi kami, itulah sinyalnya.
Claude Opus 4.7 adalah model terbaik di dunia untuk membangun dasbor dan antarmuka kaya data. Selera desainnya benar-benar mengejutkan - membuat pilihan yang benar-benar akan saya rilis. Model ini menjadi pengemudi harian default saya sekarang.
Claude Opus 4.7 adalah model paling mampu yang pernah kami uji di Quantium. Dievaluasi terhadap model AI terkemuka melalui solusi benchmarking proprietary kami, peningkatan terbesar muncul di mana hal itu paling penting: kedalaman penalaran, pembingkaian masalah yang terstruktur, dan pekerjaan teknis yang kompleks. Lebih sedikit koreksi, iterasi lebih cepat, dan output yang lebih kuat untuk memecahkan masalah tersulit yang dibawa klien kami.
Claude Opus 4.7 terasa seperti langkah naik nyata dalam kecerdasan. Kualitas kode meningkat secara nyata, memotong fungsi pembungkus yang tidak berarti dan perancah fallback yang biasa menumpuk, dan memperbaiki kodenya sendiri saat berjalan. Ini adalah lompatan paling bersih yang pernah kami lihat sejak perpindahan dari Sonnet 3.7 ke seri Claude 4.
Untuk pekerjaan penggunaan komputer yang menjadi inti pengujian penetrasi otonom XBOW, Claude Opus 4.7 baru adalah perubahan langkah: 98,5% pada benchmark ketajaman visual kami dibandingkan 54,5% untuk Opus 4.6. Poin sakit Opus tunggal terbesar kami secara efektif hilang, dan itu membuka penggunaannya untuk seluruh kelas pekerjaan di mana kami tidak dapat menggunakannya sebelumnya.
Claude Opus 4.7 adalah upgrade solid tanpa regresi untuk Vercel. Model ini fenomenal pada tugas coding satu kali, lebih benar dan lengkap daripada Opus 4.6, dan terasa lebih jujur tentang batasnya sendiri. Model ini bahkan melakukan pembuktian pada kode sistem sebelum mulai bekerja, yang merupakan perilaku baru yang belum kami lihat dari model Claude sebelumnya.
Claude Opus 4.7 sangat kuat dan mengungguli Opus 4.6 dengan peningkatan 10% hingga 15% dalam keberhasilan tugas untuk Factory Droids, dengan lebih sedikit kesalahan alat dan tindak lanjut yang lebih andal pada langkah validasi. Model ini membawa pekerjaan sepenuhnya alih-alih berhenti di tengah jalan, yang persis dibutuhkan tim rekayasa perusahaan.
Claude Opus 4.7 secara otonom membangun mesin text-to-speech Rust lengkap dari awal - model neural, kernel SIMD, demo browser - kemudian memakan outputnya sendiri melalui pengenal ucapan untuk memverifikasi bahwa itu cocok dengan referensi Python. Berbulan-bulan rekayasa senior, disampaikan secara otonom. Langkah naik dari Opus 4.6 jelas, dan basis kode bersifat publik.
Claude Opus 4.7 lulus tiga tugas TBench yang tidak bisa dilewati model Claude sebelumnya, dan model ini mendaratkan perbaikan yang terlewatkan oleh model terbaik kami sebelumnya, termasuk race condition. Model ini menunjukkan presisi kuat dalam mengidentifikasi masalah nyata, dan mengungkap temuan penting yang model lain menyerah atau tidak selesaikan. Dalam benchmark review kode dunia nyata Qodo, kami mengamati presisi tingkat atas.
Pada Databricks OfficeQA Pro, Claude Opus 4.7 menunjukkan penalaran dokumen yang lebih kuat secara berarti, dengan 21% lebih sedikit kesalahan daripada Opus 4.6 saat bekerja dengan informasi sumber. Di seluruh benchmark penalaran agen atas data kami, ini adalah model Claude dengan kinerja terbaik untuk analisis dokumen perusahaan.
Untuk Ramp, Claude Opus 4.7 menonjol dalam alur kerja tim agen. Kami melihat kesetiaan peran yang lebih kuat, kepatuhan instruksi, koordinasi, dan penalaran kompleks, terutama pada tugas rekayasa yang mencakup alat, basis kode, dan konteks debugging. Dibandingkan dengan Opus 4.6, model ini membutuhkan lebih sedikit panduan langkah demi langkah, membantu kami menskalakan alur kerja agen internal yang dijalankan tim rekayasa kami.
Claude Opus 4.7 secara terukur lebih baik daripada Opus 4.6 untuk pekerjaan pembuatan aplikasi Bolt yang lebih lama, hingga 10% lebih baik dalam kasus terbaik, tanpa regresi yang biasa kami harapkan dari model yang sangat agen. Model ini mendorong batas atas apa yang dapat dikirim pengguna kami dalam satu sesi.
Pertanyaan Umum
Kapan saya harus menggunakan Claude Opus 4.7?
Kami menawarkan model Claude di seluruh spektrum kecepatan, harga, dan kinerja. Opus 4.7 adalah model kami yang paling mampu yang tersedia secara umum. Kami merekomendasikan Opus 4.7 untuk kasus penggunaan paling menuntut Anda di mana Anda membutuhkan kecerdasan terdepan - terutama kode siap produksi, agen AI yang canggih, dan pembuatan dokumen yang kompleks.
Berapa biaya menggunakan Claude Opus 4.7?
Harga tergantung pada bagaimana Anda ingin menggunakan Opus 4.7. Untuk informasi lebih lanjut, lihat halaman harga kami.
Platform Lainnya
bagaimana cara kerja taruhan round robin
Berita Piala Dunia
Jika Anda memiliki pertanyaan, silakan kirim email ke [email protected]