Chủ nhật, ngày 06/07/2025 16:37 GMT+7
Nam Khánh (Theo AFP) Chủ nhật, ngày 06/07/2025 16:37 GMT+7
Thẩm phán liên bang William Alsup khẳng định việc công ty Anthropic sử dụng sách có bản quyền để huấn luyện mô hình AI Claude là hành vi hợp pháp và mang tính chuyển đổi.
Vào cuối tháng 6, Tòa án liên bang Mỹ đã tổ chức phiên xét xử vụ kiện giữa ba tác giả Andrea Bartz, Charles Graeber và Kirk Wallace Johnson với công ty Anthropic PBC. Nguyên đơn cáo buộc công ty này vi phạm bản quyền khi sử dụng sách của họ cùng hàng triệu đầu sách khác để huấn luyện mô hình chatbot mang tên Claude. Vụ kiện bắt đầu từ tháng 8/2024, trong bối cảnh nhiều tác giả và nhà xuất bản tại Mỹ lên tiếng phản đối các công ty AI sử dụng nội dung có bản quyền cho mục đích thương mại mà không xin phép.
Tại phiên tòa, thẩm phán William Alsup đã đưa ra nhận định quan trọng. Ông cho rằng việc sử dụng các tác phẩm có bản quyền trong quá trình huấn luyện mô hình ngôn ngữ lớn (LLM) là “sử dụng hợp lý” và mang tính “chuyển đổi rõ rệt”. Cụ thể, ông lý giải rằng việc các mô hình như Claude được huấn luyện bằng cách đọc và học hỏi từ sách giống như hành trình của một người đọc nuôi ước mơ trở thành nhà văn, tức là không nhằm sao chép nguyên văn hay thay thế tác phẩm gốc, mà để tạo ra văn bản mới với nội dung khác biệt.

Theo ông William Alsup, việc chuyển đổi từ sách giấy sang định dạng số với mục đích nghiên cứu và huấn luyện AI, đặc biệt trong trường hợp sách đã được mua hợp pháp, là hành vi phù hợp với luật bản quyền Mỹ. Dẫn chiếu từ US Copyright Act, ông khẳng định luật cho phép việc sử dụng hạn chế các tác phẩm có bản quyền mà không cần sự cho phép của chủ sở hữu nếu mục đích là tạo ra nội dung mới, có tính chuyển đổi và không làm tổn hại đến giá trị gốc của tác phẩm.
Phân biệt giữa sách hợp pháp và nội dung tải lậu
Phán quyết của thẩm phán William Alsup đồng thời làm rõ ranh giới giữa hành vi hợp pháp và bất hợp pháp trong cách Anthropic thu thập dữ liệu huấn luyện AI. Theo hồ sơ vụ án, Anthropic đã thu thập dữ liệu theo hai cách: số hóa sách sau khi mua hợp pháp bằng cách xé bìa, quét toàn bộ nội dung, lưu trữ; và tải một lượng lớn bản sách từ các trang web chia sẻ trái phép.
Thẩm phán cho rằng chỉ phần dữ liệu được mua và số hóa hợp pháp mới có thể được xem là “sử dụng hợp lý”. Trong khi đó, việc tải sách từ các nguồn không có bản quyền có thể là hành vi vi phạm và cần tiếp tục điều tra, xác minh cụ thể. Như vậy, phán quyết không miễn trách nhiệm toàn bộ cho Anthropic, mà chỉ bảo vệ một phần hành vi của công ty nếu nó được thực hiện trong khuôn khổ pháp luật.
Đại diện Anthropic đánh giá cao quyết định của tòa và cho rằng đây là bước tiến tích cực trong quá trình xác lập cơ sở pháp lý cho việc sử dụng nội dung có bản quyền nhằm phát triển công nghệ trí tuệ nhân tạo. Tuy nhiên, vụ kiện vẫn chưa kết thúc. Các bên liên quan còn phải làm rõ nhiều yếu tố, đặc biệt liên quan đến nguồn gốc dữ liệu và mục đích sử dụng cụ thể trong từng trường hợp.
Phán quyết vừa qua có thể tạo tiền lệ pháp lý quan trọng trong các vụ tranh chấp tương tự tại Mỹ. Trong bối cảnh trí tuệ nhân tạo phát triển nhanh, việc làm rõ giới hạn của “sử dụng hợp lý” và xác định các tiêu chí pháp lý liên quan sẽ ảnh hưởng sâu rộng đến hoạt động nghiên cứu và phát triển AI, cũng như quyền lợi của các tác giả, nhà xuất bản và các bên sử dụng nội dung.