عالم من «الديستوبيا».. هل يمكننا الاستماع إلى الكتب بصوت البشر؟

عندما نفكر فيما يجعل الكتاب الصوتى لا يُنسى، فغالبًا ما تكون أكثر اللحظات إنسانية: لحظة انقباض فى الحلق عند اقتراب الدموع، أو كلمات تقال بابتسامة صادقة.
تقول أنابيل تيودور، راوية الكتب الصوتية من ملبورن، إن غريزتنا كرواة قصص هى ما يجعل السرد مهارة أساسية وثمينة. وتضيف: «الصوت يكشف بسهولة مشاعرنا».
ولكن كشكل فنى، قد يكون مهددًا.
فى مايو، أعلنت شركة Audible، وهى مزود الكتب الصوتية المملوكة لشركة أمازون، عن أنها ستسمح للمؤلفين والناشرين بالاختيار من بين أكثر من ١٠٠ صوت مصممة بواسطة الذكاء الاصطناعى لسرد الكتب الصوتية باللغات الإنجليزية والإسبانية والفرنسية والإيطالية، ومن المتوقع أن تتوفر ترجمة الكتب الصوتية بتقنية الذكاء الاصطناعى فى وقت لاحق من العام- وهو خبر قوبل بالنقد والهجوم فى أوساط صناعة النشر.
فى أستراليا، حيث تقل شركات الكتب الصوتية، ويعتمد رواة ناشئون مثل تيودور على العمل لزيادة دخلهم، يتزايد القلق بشأن فقدان الوظائف والشفافية والجودة.
فى حين أن تيودور، التى روت ٤٨ كتابًا، غير مقتنعة بقدرة الذكاء الاصطناعى على تحقيق ما تفعله حتى الآن، إلا أنها قلقة من أن رداءة الجودة قد تبعد الناس عن هذه الوسيلة.
تقول: «رويت مشاهد جنسية جريئة للغاية- فالذكاء الاصطناعى لا يعرف صوت النشوة الجنسية». «ومشاهد الولادة أيضًا- أود معرفة كيف يخططون للتغلب على ذلك».
وفقًا لتقرير صادر عن شركة NielsenIQ Bookdata عام ٢٠٢٤، زاد استماع أكثر من نصف مستهلكى الكتب الصوتية الأستراليين خلال السنوات الخمس الماضية.
وعلى الصعيد الدولى، شهدت مبيعات الكتب الصوتية فى الولايات المتحدة زيادة بنسبة ١٣٪ بين عامى ٢٠٢٣ و٢٠٢٤؛ وفى المملكة المتحدة، ارتفعت إيرادات الكتب الصوتية إلى مستوى قياسى جديد بلغ ٢٦٨ مليون جنيه إسترلينى، بزيادة قدرها ٣١٪ عن عام ٢٠٢٣، وفقًا لجمعية الناشرين.
مع تزايد الطلب على المحتوى الصوتى، تبحث الشركات عن طرق أسرع وأقل تكلفة لإنتاجه. فى يناير ٢٠٢٣، أطلقت شركة أبل كتالوجًا جديدًا للكتب الصوتية، يضم كتبًا صوتية بصوت الذكاء الاصطناعى.
وفى وقت لاحق من ذلك العام، أعلنت أمازون عن أن المؤلفين الأمريكيين الذين ينشرون أعمالهم بأنفسهم على «كيندل» يمكنهم تحويل كتبهم الإلكترونية إلى كتب صوتية باستخدام تقنية «الصوت الافتراضى» المدعومة بالذكاء الاصطناعى- وهناك الآن عشرات الآلاف من هذه الكتب الصوتية المولدة حاسوبيًا متاحة عبر Audible.
وفى فبراير من هذا العام، كجزء من التحول العام نحو الكتب الصوتية، أعلنت Spotify عن أنها ستقبل الكتب الصوتية المدعومة بالذكاء الاصطناعى «لخفض حاجز الدخول» للمؤلفين الذين يأملون فى العثور على المزيد من القراء.
تقول Audible إن أهدافها متشابهة: استكمال السرد البشرى، لا استبداله، مما يسمح لمزيد من المؤلفين والعناوين بالوصول إلى جمهور أوسع.
فى الولايات المتحدة، تختبر Audible أيضًا نسخة صوتية لرواة الكتب الصوتية، لإنشاء نسخ طبق الأصل من أصواتهم، مما «يمكن المشاركين من توسيع قدراتهم الإنتاجية للكتب الصوتية عالية الجودة».
وصرح متحدث باسم Audible لصحيفة الجارديان: «فى عامى ٢٠٢٣ و٢٠٢٤، وظفت Audible Studios عددًا أكبر من الرواة البشريين أكثر من أى وقت مضى». «ما زلنا نتلقى من المبدعين الراغبين فى إتاحة أعمالهم صوتيًا، للوصول إلى جماهير جديدة عبر لغات مختلفة».
لكن الرواة الآليين سيظلون دائمًا أقل تكلفة من البشر- ويخشى العاملون فى قطاعى الرواية الصوتية والكتب، أن يشكل التحول إلى الذكاء الاصطناعى تهديدًا للعاملين.
انطلقت مسيرة «دورجى سولو» كراو بعد أن بدأ بأداء أصوات روايات الكاتب الأسترالى الأكثر مبيعًا فى مجال الجريمة كريس هامر، وقد روى حتى الآن حوالى ٧٠ كتابًا صوتيًا.
يعتقد سولو أن السرد بالذكاء الاصطناعى أداة ابتكرها أشخاص «لا يدركون القيمة والتقنية والمهارات» اللازمة لإنتاج كتب صوتية عالية الجودة.
ويقول: «لقد بذلنا جهودًا مضنية للوصول إلى ما نحن عليه الآن، والاعتقاد بأنه يمكنك ببساطة الضغط على زر والحصول على شىء مماثل، أو جيد بما يكفى، أمر مثير للسخرية».
يقول سيمون كينيدى، رئيس الجمعية الأسترالية لرواة الأصوات، إنه لطالما كان هناك جدل حول أجر الراوى فى أستراليا. فمقابل كل ساعة من كتاب صوتى، قد يقضى الراوى ضعف أو ثلاثة أضعاف هذا الوقت فى تسجيله، وهذا لا يشمل القراءة الأولية لفهم الكتاب وشخصياته.
يقول: «رأيى الشخصى هو أن إدخال رواة الذكاء الاصطناعى يهدف إلى زيادة حجم الصوت على حساب الجودة، ويهدف إلى تقليص تكلفة العملية».
أسس كينيدى الجمعية الأسترالية لرواة الصوت عام ٢٠٢٤ استجابة للتهديد الذى يشكله الذكاء الاصطناعى. وفقًا لتقرير تم تقديمه إلى لجنة برلمانية العام الماضى، أفادت المنظمة بأن ٥٠٠٠ وظيفة تمثيل صوتى فى أستراليا معرضة للخطر.
لم يفاجأ كينيدى بإعلان Audible، لكنه يقول إنه يعتقد أنها «خطوة غبية جدًا».
ويضيف: «يتمتع راوى الكتب الصوتية بعلاقة خاصة وحميمة مع المستمع، لذا فإن محاولة القيام بأى شىء أقل ارتباطًا تعد خطوة حمقاء».
أما بالنسبة لفرصة استنساخ أصواتهم، فيقول إنه ينبغى أن يكون لممثلى الصوت الحق فى المشاركة، لكن لا ينبغى لهم أن يتوقعوا «أجرًا قريبًا من نفس الأجر، ويخاطرون بتحويل طابعهم الصوتى الفريد- علامتهم الصوتية- إلى صوت آلى ينتج بكميات كبيرة، وسرعان ما يمل المستمعون من سماعه».
يقول: «إذا كان السرد الخالى من المشاعر وبصوت ثابت هو كل ما تحتاجه للحصول على جودة عالية، فبالتأكيد». «ولكن إذا كان سرد القصص الجذاب والمثير للاهتمام هو نسختك من الجودة العالية، فلا تنتظر بفارغ الصبر أن يمنحك الذكاء الاصطناعى ذلك».
ومن المخاوف الرئيسية الأخرى افتقار أستراليا إلى تنظيم الذكاء الاصطناعى. فبينما لدى الاتحاد الأوروبى قانونه الخاص بالذكاء الاصطناعى، ولدى الصين وإسبانيا قوانين لوضع العلامات على المحتوى المنتج بواسطة الذكاء الاصطناعى، فإن أستراليا متأخرة فى هذا المجال.
ويقول كينيدى: «لا توجد قوانين تمنع استخراج البيانات أو استنساخ الأصوات دون موافقة، أو إنشاء مقاطع فيديو مزيفة عميقة للأشخاص». «كما لا توجد قوانين لوضع العلامات أو قوانين تلزم بوضع علامة مائية على المحتوى المنتج بواسطة الذكاء الاصطناعى وأصوله؛ ولا قوانين تلزم بشفافية بيانات التدريب؛ ولا قوانين تملى الاستخدام المناسب للمقاطع الصوتية المزيفة العميقة أو استنساخ الأصوات أو النصوص المنتجة بواسطة الذكاء الاصطناعى».
هذا العام، كانت هانا كينت، مؤلفة كتابى «طقوس الدفن والتفانى»، واحدة من بين العديد من الكتّاب الأستراليين المشهورين الذين صُدموا باكتشاف استخدام أعمالهم المقرصنة لتدريب أنظمة الذكاء الاصطناعى فى ميتا.
تقول كينت إنه فى حين أن رد فعلها الأولى على إدخال الذكاء الاصطناعى فى المجالات الإبداعية كان عادة «رفضًا وغضبًا»، إلا أنها تثير فضولها بشأن إعلان شركة Audible عن الذكاء الاصطناعى- وتحديدًا خططها لإطلاق اختبارات تجريبية للذكاء الاصطناعى لترجمة النصوص إلى لغات مختلفة.
وتضيف كينت: «أعتقد أنه من الواضح أن السبب الرئيسى لاستخدام الذكاء الاصطناعى هو التكاليف، وأعتقد أن هذا سيقلل من قيمة الأشياء بالمعنى الحرفى، ويقلل من قيمتها بالمعنى الإبداعى- بمعنى تكريمنا لرواية القصص، والدافع الفنى والإبداعى».
يعتقد تيودور وسوالو أن الشركات الكبرى ستواجه صعوبة فى استبدال السرد البشرى كليًا، ويعود ذلك جزئيًا إلى معارضة العديد من الكتّاب الأستراليين لذلك.
لكن يبقى أن نرى ما إذا كان المستمعون سيتمكنون من تمييز الفرق أم لا.
يقول تيودور: «الآن، بدأنا نسير نحو عالم ديستوبيا. هل يمكننا ببساطة الاستماع إلى البشر بدلًا من الروبوتات؟».