
در حالی که هوش مصنوعی به سرعت در حال تغییر نحوه پردازش و تولید اطلاعات است، مسائل حقوقی پیرامون آن پیچیدهتر میشود. OpenAI ادعا دارد که DeepSeek از دادههای بهدستآمده از API این شرکت برای آموزش مدلهای خود استفاده کرده است، اقدامی که از نگاه OpenAI، فراتر از یادگیری و بیشتر شبیه کپیبرداری مستقیم است. این در حالی است که خود OpenAI با شکایتهایی مشابه از سوی ناشران بزرگی مانند نیویورک تایمز مواجه شده است. اما تفاوت در چیست؟ آیا میتوان مرز مشخصی میان «الهام گرفتن» و «سرقت داده» ترسیم کرد؟
شکایت OpenAI علیه DeepSeek را میتوان در دو سطح بررسی کرد: یکی از منظر فنی و دیگری از منظر حقوقی و اخلاقی. از نگاه فنی، مسئله اصلی این است که آیا DeepSeek از دادههای API OpenAI برای ساخت مدلهای خود استفاده کرده یا خیر؟ در حوزه هوش مصنوعی، بسیاری از مدلها از دادههای متنباز یا عمومی برای آموزش استفاده میکنند، اما اگر ادعای OpenAI درست باشد، DeepSeek بهجای استفاده از دادههای عمومی، مستقیماً به خروجی مدلهای ChatGPT دسترسی پیدا کرده و آنها را بهعنوان داده آموزشی به کار برده است. این اقدام، اگر تأیید شود، تفاوتی اساسی با روشهای مرسوم یادگیری از دادههای متنباز دارد.
اما از منظر حقوقی، ماجرا پیچیدهتر میشود. OpenAI در حالی DeepSeek را به استفاده غیرمجاز از دادههایش متهم میکند که خود با شکایتهایی مشابه از سوی ناشران مواجه شده است. در پروندههایی مانند شکایت نیویورک تایمز، این ادعا مطرح شده که OpenAI از محتوای دارای حق نشر برای آموزش مدلهای خود بهره برده است. این تناقض باعث شده تا بسیاری، اقدام OpenAI را نوعی «نفاق» تلقی کنند. اما کریس لِهین، مدیر امور جهانی OpenAI، از تفاوت بین این دو نوع استفاده دفاع کرده است. او مقایسهای جالب ارائه میدهد: یادگیری از یک کتاب در کتابخانه را مجاز میداند، اما تغییر جلد همان کتاب و فروش آن را غیرقابل قبول میداند.
این استدلال، در نگاه اول منطقی به نظر میرسد، اما چالش اصلی اینجاست که مرز میان الهامگیری و کپیبرداری در حوزه هوش مصنوعی بسیار مبهم است. مدلهای زبانی مانند ChatGPT بر اساس دادههایی که دریافت میکنند، پاسخهایی تولید میکنند که گاه به محتوای اصلی شباهت زیادی دارند. ازاینرو، تفکیک میان «استفاده مشروع» و «کپیبرداری غیرمجاز» همواره موضوعی بحثبرانگیز بوده است.
از منظر تجاری نیز این پرونده نشان میدهد که شرکتهای پیشروی هوش مصنوعی اکنون درگیر جنگی جدید شدهاند: نبرد بر سر دادهها. در گذشته، چالش اصلی، بهبود کیفیت مدلها بود، اما امروز مسئله اصلی، دسترسی انحصاری به دادههایی است که این مدلها را تغذیه میکنند. در صورتی که OpenAI موفق شود DeepSeek را به نقض حقوقش متهم کند، این میتواند رویهای جدید در قوانین مالکیت دادههای هوش مصنوعی ایجاد کند، که در آینده میتواند به محدودیتهای بیشتری برای رقبا منجر شود.
در نهایت، این پرونده تنها یکی از نمونههای درگیریهای حقوقی در دنیای هوش مصنوعی است. با رشد سریع این فناوری، نیاز به وضع قوانین و چارچوبهای مشخص برای استفاده از دادهها بیش از پیش احساس میشود. اما تا آن زمان، جنگ میان شرکتهای هوش مصنوعی بر سر مالکیت دادهها، با شدت بیشتری ادامه خواهد یافت.