نبرد OpenAI و DeepSeek؛ رقابت یا نقض مالکیت داده؟

در دسته مطالب: تحلیل و بررسی تخصصی
بهمن 23, 1403
نبرد OpenAI و DeepSeek؛ رقابت یا نقض مالکیت داده؟
در دنیای پرشتاب هوش مصنوعی، رقابت دیگر فقط بر سر نوآوری نیست، بلکه به میدان جدی مالکیت داده‌ها و حقوق فکری کشیده شده است. OpenAI که خود درگیر چالش‌های حقوقی بر سر استفاده از داده‌های دیگران است، این بار در نقش شاکی ظاهر شده و DeepSeek را متهم به استفاده غیرمجاز از داده‌هایش کرده است. این تقابل، پرسش‌های جدی درباره حد و مرز استفاده از داده‌ها در آموزش مدل‌های هوش مصنوعی ایجاد کرده است.

در حالی که هوش مصنوعی به سرعت در حال تغییر نحوه پردازش و تولید اطلاعات است، مسائل حقوقی پیرامون آن پیچیده‌تر می‌شود. OpenAI ادعا دارد که DeepSeek از داده‌های به‌دست‌آمده از API این شرکت برای آموزش مدل‌های خود استفاده کرده است، اقدامی که از نگاه OpenAI، فراتر از یادگیری و بیشتر شبیه کپی‌برداری مستقیم است. این در حالی است که خود OpenAI با شکایت‌هایی مشابه از سوی ناشران بزرگی مانند نیویورک تایمز مواجه شده است. اما تفاوت در چیست؟ آیا می‌توان مرز مشخصی میان «الهام گرفتن» و «سرقت داده» ترسیم کرد؟

شکایت OpenAI علیه DeepSeek را می‌توان در دو سطح بررسی کرد: یکی از منظر فنی و دیگری از منظر حقوقی و اخلاقی. از نگاه فنی، مسئله اصلی این است که آیا DeepSeek از داده‌های API OpenAI برای ساخت مدل‌های خود استفاده کرده یا خیر؟ در حوزه هوش مصنوعی، بسیاری از مدل‌ها از داده‌های متن‌باز یا عمومی برای آموزش استفاده می‌کنند، اما اگر ادعای OpenAI درست باشد، DeepSeek به‌جای استفاده از داده‌های عمومی، مستقیماً به خروجی مدل‌های ChatGPT دسترسی پیدا کرده و آن‌ها را به‌عنوان داده آموزشی به کار برده است. این اقدام، اگر تأیید شود، تفاوتی اساسی با روش‌های مرسوم یادگیری از داده‌های متن‌باز دارد.

اما از منظر حقوقی، ماجرا پیچیده‌تر می‌شود. OpenAI در حالی DeepSeek را به استفاده غیرمجاز از داده‌هایش متهم می‌کند که خود با شکایت‌هایی مشابه از سوی ناشران مواجه شده است. در پرونده‌هایی مانند شکایت نیویورک تایمز، این ادعا مطرح شده که OpenAI از محتوای دارای حق نشر برای آموزش مدل‌های خود بهره برده است. این تناقض باعث شده تا بسیاری، اقدام OpenAI را نوعی «نفاق» تلقی کنند. اما کریس لِهین، مدیر امور جهانی OpenAI، از تفاوت بین این دو نوع استفاده دفاع کرده است. او مقایسه‌ای جالب ارائه می‌دهد: یادگیری از یک کتاب در کتابخانه را مجاز می‌داند، اما تغییر جلد همان کتاب و فروش آن را غیرقابل قبول می‌داند.

این استدلال، در نگاه اول منطقی به نظر می‌رسد، اما چالش اصلی اینجاست که مرز میان الهام‌گیری و کپی‌برداری در حوزه هوش مصنوعی بسیار مبهم است. مدل‌های زبانی مانند ChatGPT بر اساس داده‌هایی که دریافت می‌کنند، پاسخ‌هایی تولید می‌کنند که گاه به محتوای اصلی شباهت زیادی دارند. ازاین‌رو، تفکیک میان «استفاده مشروع» و «کپی‌برداری غیرمجاز» همواره موضوعی بحث‌برانگیز بوده است.

از منظر تجاری نیز این پرونده نشان می‌دهد که شرکت‌های پیشروی هوش مصنوعی اکنون درگیر جنگی جدید شده‌اند: نبرد بر سر داده‌ها. در گذشته، چالش اصلی، بهبود کیفیت مدل‌ها بود، اما امروز مسئله اصلی، دسترسی انحصاری به داده‌هایی است که این مدل‌ها را تغذیه می‌کنند. در صورتی که OpenAI موفق شود DeepSeek را به نقض حقوقش متهم کند، این می‌تواند رویه‌ای جدید در قوانین مالکیت داده‌های هوش مصنوعی ایجاد کند، که در آینده می‌تواند به محدودیت‌های بیشتری برای رقبا منجر شود.

در نهایت، این پرونده تنها یکی از نمونه‌های درگیری‌های حقوقی در دنیای هوش مصنوعی است. با رشد سریع این فناوری، نیاز به وضع قوانین و چارچوب‌های مشخص برای استفاده از داده‌ها بیش از پیش احساس می‌شود. اما تا آن زمان، جنگ میان شرکت‌های هوش مصنوعی بر سر مالکیت داده‌ها، با شدت بیشتری ادامه خواهد یافت.