OpenAI đang bị kiện tụng vì đào tạo ChatGPT bằng dữ liệu cá nhân 'đã được ăn cắp'.

ChatGPT logo on a smartphone in front of a projection of the OpenAI logo

Một công ty luật ở California cho rằng ChatGPT được xây dựng bằng cách sử dụng dữ liệu ‘đã được ăn cắp’. Credit: Getty Images

Một công ty luật ở California đã đưa ra một kiện tụng lớp hành vi trước tòa án Miền Bắc California vào thứ Tư, bằng cách lập cáo OpenAI về việc “ăn cắp” dữ liệu cá nhân để huấn luyện ChatGPT.

Công ty luật Clarkson, trong một khiếu nại được đưa ra trước tòa án Miền Bắc California vào thứ Tư, bằng cách lập cáo OpenAI về việc ChatGPT và Dall-E “sử dụng dữ liệu cá nhân riêng tư, bao gồm thông tin có thể định danh cá nhân, từ hàng trăm triệu người dùng internet, bao gồm cả trẻ em mọi lứa tuổi, mà không có sự đồng ý thông tin hoặc biết đến”. Để huấn luyện mô hình ngôn ngữ lớn của mình, OpenAI đã lấy dữ liệu từ internet từ 300 tỷ từ, bao gồm thông tin cá nhân và bài đăng từ các trang mạng xã hội như Twitter và Reddit. Công ty luật cho rằng OpenAI “đã làm như vậy bí mật, và không đăng ký làm nhà cung cấp dữ liệu như nó được yêu cầu làm theo luật hiện hành”.

OpenAI đã trở thành một đối tượng tranh cãi về cách và dữ liệu nào nó thu thập để huấn luyện và phát triển ChatGPT. Cho đến gần đây, không có cách rõ ràng để người dùng tự do lựa chọn không cho phép OpenAI sử dụng cuộc trò chuyện và thông tin cá nhân của họ để đổ vào mô hình. ChatGPT ban đầu bị cấm tại Ý, sử dụng Chính sách Bảo vệ Dữ liệu Chung (GDPR) của Châu Âu, vì không bảo vệ đủ dữ liệu người dùng, đặc biệt là trẻ em. Kiện tụng này bao gồm các chính sách riêng tư mờ đục của OpenAI cho người dùng hiện tại, nhưng chủ yếu nhắm vào dữ liệu được lấy từ web mà không bao giờ được ý định rõ ràng để chia sẻ với ChatGPT. Qua các đầu tư tỷ đô của Microsoft và doanh thu thuê bao của ChatGPT Plus, OpenAI đã lợi nhuận từ dữ liệu này mà không bù lại nguồn gốc của nó.

15 điều kiện trong khiếu nại bao gồm vi phạm quyền riêng tư, thiếu thốn trong việc bảo vệ dữ liệu cá nhân và trộm cắp bằng cách lấy vô vình một lượng lớn dữ liệu cá nhân để huấn luyện các mô hình của mình. Các tập dữ liệu như Common Crawl, Wikipedia và Reddit, bao gồm thông tin cá nhân, có sẵn công cộng bất cứ khi nào các công ty tuân thủ các giao thức mua và sử dụng dữ liệu này. Nhưng OpenAI đã sử dụng dữ liệu này mà không có sự cho phép hoặc đồng ý của người dùng trong bối cảnh của ChatGPT. Mặc dù thông tin cá nhân của mọi người là công cộng trên các trang mạng xã hội, blog và bài báo, nếu dữ liệu được sử dụng ngoài nền tảng đã dự kiến, nó có thể được coi là vi phạm quyền riêng tư.

Ở Châu Âu, có một sự khác biệt pháp lý giữa lĩnh vực công cộng và dữ liệu miễn phí sử dụng dựa trên luật GDPR, nhưng ở Mỹ, điều đó vẫn còn để thảo luận. Nader Henein, Phó Giám đốc Nghiên cứu Quyền riêng tư tại Gartner, người nghĩ rằng cảm xúc của kiện tụng là hợp lý, đã nói: “Mọi người nên có quyền kiểm soát cách dữ liệu của họ được sử dụng, ngay cả khi nó có sẵn trong lĩnh vực công cộng”. Nhưng Henein không chắc rằng hệ thống pháp lý Mỹ sẽ đồng ý.

Ryan Clarkson, đối tác quản lý đã nói trong bài đăng trên blog của công ty(opens in a new tab), rằng việc hành động ngay bây giờ với luật hiện hành là rất quan trọng thay vì chờ đợi các cơ quan Thực thi và Thục thi trả lời với quy định liên bang. “Ch
Đang xảy ra một tranh chấp về bản quyền giữa OpenAI và một cá nhân không xác định, khiến những người quan tâm phải điều tra nhuộm sâu hơn.

OpenAI là một công ty nghiên cứu trao đổi lớn và nổi tiếng của Mỹ, có trụ sở tại San Francisco. Họ đã đầu tư một khoảng thời gian dài trong việc tiếp nhận, đào tạo và chạy công nghệ AI toán công và trao đổi.

Người cá nhân không xác định vừa buộc OpenAI phải đòi bồi thường vì họ “đã ăn cắp” dữ liệu cá nhân của họ, để đào tạo ChatGPT, một công cụ trao đổi thuật toán khác của OpenAI.

Họ cực kỳ ít được biết về nội dung của tranh chấp, nhưng có thể đề nghị rằng đây là một tranh chấp hợp đồng, vì một người đã thực hiện hợp đồng cũng có lợi nhuận rõ ràng, (tức là tranh chấp tranh bằng tranh đòan thường có một trong hai bên đã thực hiện tuyệt đối một điều khoản của hướng dẫn hoặc đã thiếu thật số hoạt động liên quan đến nội dung của hợp đồng). Người đòi bồi thường đã đề nghị OpenAI, nhưng bên cạnh đó, họ cũng nhờ lãnh đạo của California để thông báo cho OpenAI rằng họ có thể phải chịu một khiểu phạt trong trường hợp họ không xử lý tranh chấp.

Tuy hiện đây OpenAI đã bác bỏ bất kỳ tranh chấp nào bằng các lựa chọn hình thức thanh toán, nhưng thực tế là Viện Vân Hồng vẫn còn nằm trong trạng thái phân vân hồn hỏi. Liên hệ sẽ được lấy lại bằng phương pháp nào để giải quyết vấn đề này, chưa biết.

Post Views: 95

Leave a Reply Cancel reply