تخفيض تكاليف الترجمة باستخدام النص المرقم | أصلي، ترجم بواسطة AI

Home 2025.07

مدونتي التي تعمل على Jekyll تستخدم Markdown لكتابة الفقرات. بعد الكتابة بالإنجليزية، أستخدم أدوات الذكاء الاصطناعي مثل DeepSeek أو Mistral لتحويلها إلى ثمانية لغات أخرى. على الرغم من أن التكاليف منخفضة بالفعل، إلا أن هناك مجالاً للتحسين.

في بعض الأحيان، أقوم بتحرير كلمة أو فقرة واحدة، ثم يتم ترجمة النص بأكمله للمقالة إلى اللغات الثمانية الأخرى. في هذه الحالة، يكون استخدام الرموز عالياً. إذا قمت بترجمة الفقرة المعدلة فقط مرة أخرى، فسيكون استخدام الرموز أقل، خاصة للمقالات الطويلة.

ومع ذلك، أريد استخدام Markdown لتسجيل أفكاري. استخدام قاعدة بيانات لإدارة وتحديث المقالات غير مريح. قد يكون استخدام YAML أو JSON معقداً أيضاً.

المركز هو تحديد الفروق بين النص قبل وبعد التعديل. إذا استخدمنا طريقة الفقرات، فهذا يعني تقسيم النص باستخدام حرف newline “\n”.

أحتاج إلى معرفة أي الفقرات التي تغيرت وأيها لم تتغير بعد التعديل. يجب أن نحدد تطابقات واحدة إلى واحدة بين الفقرات في النص قبل وبعد التعديل.

نستخدم طريقة الفقرات لأننا نريد تحديث الترجمات التي يقوم بها نماذج الذكاء الاصطناعي. إذا استخدمنا الجمل، فقد لا تكون دقيقة.

للماركداون، قد يكون من المهم استخدام تحليل الماركداون لتزامن الترجمات بناءً على عناصر الماركداون.

لكن إذا لم يكن هناك كتل من الكود أو صيغ خاصة للماركداون، فيمكننا استخدام طريقة الفقرات.

لطريقة الفقرات البسيطة، لدينا مصفوفتان من الفقرات ونحتاج إلى معرفة كيفية تطابقهما.

عند مقارنة أي فقرة في هذه المصفوفتين، هناك نتيجة محتملة: إما أنها متطابقة أو مختلفة. إذا كانت مختلفة، هناك عدة حالات: كلاهما جديد، أو أن اليسار جديد، أو أن اليمين جديد.

أريد فقط تخفيض التكاليف، لذلك أهدف إلى تقليل استخدام الرموز. لا أحتاج إلى أي شيء آخر. أريد فقط ترجمة كل فقرة، تخزين النتيجة، وفي المرة التالية، سأبحث عن نتيجة الترجمة لكل فقرة. إذا لم تكن موجودة، فسيتعين علي ترجمتها مرة أخرى.

للماركداون، الأمر أكثر تعقيدًا قليلاً. لا أريد ترجمة كتل الكود. لذلك، يمكننا استخدام مكتبة تحليل الماركداون لمعالجة كتل الكود والنص العادي بشكل مختلف.

في غضون أسابيع قليلة، سأقوم بتطبيق ذلك باستخدام Python وGrok لأن هذا مشكلة حقيقية. يجب علي حلها.

واحدة من التصميمات تتعلق بمجلدات التخزين المؤقت. أخزن التخزين المؤقت في مجلد التخزين المؤقت مع ملفات مثل lang.json، مثل zh.json وما إلى ذلك.


Back Donate