قاموس المصطلحات

قاموس فيديو الذكاء الاصطناعي

كل مصطلح ستواجهه عند صناعة الفيديو بالذكاء الاصطناعي — من أساسيات الكاميرا والبرامج الترميزية إلى الانتشار، والأفاتارات، والإنتاج الذاتي — بصياغة عربية مبسطة.

74 مصطلحات · فيديو · الذكاء الاصطناعي · فيديو الذكاء الاصطناعي

74 مصطلحات
استنساخ الصوتفيديو الذكاء الاصطناعي
إعادة إنشاء صوت شخص محدد من عيّنة قصيرة ليتمكن من نطق نص جديد بنفس الصوت.
استيفاء الإطاراتفيديو الذكاء الاصطناعي
توليد إطارات وسيطة لرفع معدل الإطارات أو تنعيم الحركة — مثل تحويل 24fps إلى 60fps حريري.
الاتساق الزمنيفيديو الذكاء الاصطناعي
الحفاظ على ثبات الشخصيات والأشياء والأسلوب من إطار لآخر كي لا يومض الفيديو أو يتلوّى أو يتشوّه بشكل غير طبيعي.
الإخراج / التصييرفيديو
معالجة المشروع إلى ملف فيديو نهائي — أو، في الذكاء الاصطناعي، توليد النموذج للإطارات إلى مقطع نهائي.
الاستبدال اللوني (الشاشة الخضراء)فيديو
استبدال خلفية ذات لون موحّد — غالبًا أخضر — بصورة أو فيديو آخر بجعل ذلك اللون شفافًا.
الاستدلالالذكاء الاصطناعي
تشغيل نموذج مدرّب مسبقًا لإنتاج مخرج — مثل توليد فيديوك من أمر نصي. هذا ما تُحاسب عليه لكل عملية توليد.
الإطار المفتاحيفيديو
في المونتاج: إطار مُعلَّم يحدد قيمة (الموضع، المقياس، العتامة) ويتولى البرنامج التحريك بينها. في الضغط: إطار مرجعي كامل تُعاد منه بناء الإطارات المجاورة.
الأمر النصيالذكاء الاصطناعي
التوجيه الذي تقدّمه للنموذج — غالبًا نص، وأحيانًا مع صورة — يصف الفيديو الذي تريد إنشاؤه.
الانتقالفيديو
كيفية الانتقال من لقطة إلى أخرى — قطْع مباشر، تلاشي، غَمْق، أو مسح.
البذرةالذكاء الاصطناعي
رقم عشوائي مبدئي لعملية التوليد. إعادة استخدام البذرة نفسها مع الأمر نفسه يعيد النتيجة ذاتها — مفيد للاتساق والتعديلات الصغيرة.
التحكم بالكاميرافيديو الذكاء الاصطناعي
توجيه حركات كاميرا افتراضية — تحريك أفقي، تقريب، دوران، دوللي — داخل لقطة مولّدة بالذكاء الاصطناعي.
التحكم في الحركة / فرشاة الحركةفيديو الذكاء الاصطناعي
أدوات تتيح لك توجيه مكان وكيفية حركة العناصر في مقطع مُولَّد بدل تركها كليًا للنموذج.
التدريبالذكاء الاصطناعي
تعليم النموذج عبر عرض كميات هائلة من البيانات وضبط معاييره الداخلية تدريجيًا حتى ينتج نتائج جيدة.
الترجمة النصيةفيديو
نص على الشاشة للكلام المسموع. الترجمة الوصفية تشمل الأصوات والمتحدثين لإتاحة الوصول؛ والترجمة غالبًا تنقل الحوار أو تترجمه.
التركيب البصريفيديو
طبقات متعددة من العناصر المرئية — لقطات، رسوم، مؤثرات، نص — تُدمج في إطار واحد.
التضمينالذكاء الاصطناعي
قائمة أرقام (متّجه) تلتقط معنى نص أو صورة أو صوت، ليقارن النموذج المدخلات المختلفة ويجمعها.
التعلّم العميقالذكاء الاصطناعي
تعلّم آلي يستخدم شبكات عصبية متعددة الطبقات. يحرّك نماذج الصور والفيديو والصوت واللغة اليوم.
التلوين الداخلي / الخارجيفيديو الذكاء الاصطناعي
ملء جزء من الإطار (التلوين الداخلي) أو التمدد خارج حدوده (الخارجي). في الفيديو، يُستخدم لإزالة أو استبدال أو توسيع مناطق عبر الزمن.
الحاوية (صيغة الملف)فيديو
الغلاف الذي يجمع الفيديو والصوت والبيانات الوصفية — MP4 أو MOV أو WebM أو MKV. وهي منفصلة عن برنامج الترميز داخلها.
الدقةفيديو
أبعاد البكسل لكل إطار، تُكتب عرض × ارتفاع (مثال: 1920×1080). كلما زاد عدد البكسلات زاد التفصيل. المستويات الشائعة: 720p (HD)، و1080p (Full HD)، و4K، و8K.
الشبكة العصبيةالذكاء الاصطناعي
نموذج مستوحى من الدماغ: طبقات من «عُصبونات» مترابطة تتعلم الأنماط من البيانات. وهو أساس التوليد الحديث بالذكاء الاصطناعي.
الشريط السفليفيديو
نص يوضع في الجزء السفلي من الإطار، عادةً اسم المتحدث وصفته، أو ترجمة.
الضبط الدقيقالذكاء الاصطناعي
مزيد من تدريب نموذج أساسي على بيانات محددة لتخصيصه — لأسلوب أو علامة تجارية أو شخصية بعينها.
العلامة المائيةفيديو
شعار أو نص يُوضع فوق الفيديو لإثبات الملكية. العديد من المولّدات المجانية تضيفها؛ الخطط المدفوعة غالبًا تزيلها.
الفضاء الكامنالذكاء الاصطناعي
تمثيل رياضي مضغوط يعمل فيه النموذج فعليًا. تتم عملية التوليد هنا أولًا، ثم تُفك إلى بكسلات مرئية.
اللقطةفيديو
مقطع متواصل واحد من التصوير. الأنواع الشائعة: اللقطة الواسعة، والمتوسطة، والقريبة.
اللقطة التأسيسيةفيديو
لقطة افتتاحية واسعة تحدد موقع ومحيط المشهد قبل الاقتراب أكثر.
المحوّل (Transformer)الذكاء الاصطناعي
بنية شبكات عصبية قائمة على «الانتباه» الذي يزن علاقة أجزاء الإدخال ببعضها. تدعم نماذج اللغة الكبيرة وكثيرًا من نماذج الفيديو الحديثة.
المعلمات (الأوزان)الذكاء الاصطناعي
الأرقام الداخلية التي يتعلمها النموذج أثناء التدريب. تخزن ما «يعرفه» النموذج؛ زيادة المعلمات قد تعني قدرة أكبر.
النموذجالذكاء الاصطناعي
نظام ذكاء اصطناعي مدرّب يحوّل إدخالًا — كأمر نصي — إلى إخراج كالفيديو. لكل نموذج نقاط قوة وسرعات وأسعار مختلفة.
الهلوسةالذكاء الاصطناعي
عندما يُنتج النموذج مخرجات واثقة لكنها خاطئة أو مختلقة — مثل نص مشوّه، أو أصابع زائدة، أو حركة مستحيلة.
أشرطة التظليلفيديو
أشرطة سوداء تُضاف أعلى وأسفل (أو على الجانبين) ليتوافق الفيديو مع نسبة عرض مختلفة دون قص الصورة.
أفاتار ذكاء اصطناعيفيديو الذكاء الاصطناعي
مقدّم على الشاشة مولَّد أو مُستنسخ بالذكاء الاصطناعي يمكنه إلقاء نصّك بصوت ولغة تختارهما.
أمر سلبيالذكاء الاصطناعي
وصف لما لا تريده في الناتج. يوجّه النموذج بعيدًا عن أشياء أو أساليب أو عيوب غير مرغوبة.
أول إطار وآخر إطارفيديو الذكاء الاصطناعي
تزويد النموذج بإطار بداية و/أو نهاية ليقوم بتحريك ما بينهما، مانحًا تحكمًا دقيقًا ببداية اللقطة ونهايتها.
إنسان رقمي / توأم رقميفيديو الذكاء الاصطناعي
نسخة فوتوريالية بالذكاء الاصطناعي لشخص حقيقي، تُدرَّب مرة وتُعاد استخدامها كمقدّم أمام الكاميرا.
برنامج الترميز (Codec)فيديو
الخوارزمية التي تضغط الفيديو وتفك ضغطه — مثل H.264 وH.265/HEVC وAV1 وVP9. توازن بين جودة الصورة وحجم الملف.
بوكيهفيديو
طمس خلفي ناعم ومبهج خارج نطاق التركيز، يظهر غالبًا كدوائر ضوئية متوهجة.
تحويل الصورة إلى فيديو (I2V)فيديو الذكاء الاصطناعي
إحياء صورة ثابتة كفيديو، غالبًا بتوجيه أمر نصي يصف الحركة المطلوبة.
تحويل الفيديو إلى فيديو (V2V)فيديو الذكاء الاصطناعي
تحويل مقطع موجود إلى أسلوب أو مظهر جديد مع الحفاظ على حركته وتوقيته الأصليين.
تحويل النص إلى فيديو (T2V)فيديو الذكاء الاصطناعي
توليد مقطع فيديو مباشرة من وصف مكتوب — دون حاجة إلى كاميرا أو ممثلين أو لقطات مخزونة.
تحويل النص إلى كلام (TTS)فيديو الذكاء الاصطناعي
تحويل نص مكتوب إلى صوت منطوق طبيعي بصوت اصطناعي — المحرّك وراء التعليق الصوتي بالذكاء الاصطناعي.
ترقية الدقةفيديو الذكاء الاصطناعي
استخدام الذكاء الاصطناعي لزيادة دقة الفيديو — مثل 1080p إلى 4K — بإضافة تفاصيل مُحتمَلة بدل تمديد البكسلات فقط.
تصحيح الألوان (Color grading)فيديو
الخطوة الإبداعية لضبط اللون والتباين والمزاج في مرحلة ما بعد الإنتاج لمنح اللقطات طابعًا متسقًا ومقصودًا.
تمديد الفيديوفيديو الذكاء الاصطناعي
متابعة مقطع لما بعد طوله الأصلي عبر توليد إطارات إضافية تكمّل المشهد طبيعيًا.
حديث الرأسفيديو الذكاء الاصطناعي
فيديو يتمحور حول شخص يتحدث للكاميرا — حالة استخدام كلاسيكية للأفاتارات والمقدّمين بالذكاء الاصطناعي.
خطوات العيّنةالذكاء الاصطناعي
عدد التكرارات التي يجريها نموذج الانتشار لتحويل الضوضاء إلى الإطار النهائي. مزيد من الخطوات قد يعني جودة أعلى لكن أبطأ وكلفة أكبر.
دبلجة بالذكاء الاصطناعيفيديو الذكاء الاصطناعي
استبدال الصوت المنطوق أو إضافته بلغة أخرى، ويفضّل مطابقته لصوت المتحدث وحركة شفتيه.
ديب فيكفيديو الذكاء الاصطناعي
وسائط مُصطنعة تستبدل أو تُلفّق وجه شخص أو صوته بواقعية. قوية، لكنها تثير قضايا حقيقية حول الموافقة والأصالة والقانون.
رمز (Token)الذكاء الاصطناعي
أصغر جزء من الإدخال يعالجه النموذج — جزء من كلمة في النص، أو رقعة/إطار في الفيديو.
صورة مرجعيةفيديو الذكاء الاصطناعي
صورة تقدّمها للنموذج لتوجيه موضوع الفيديو أو شخصيته أو أسلوبه.
عمق المجالفيديو
مقدار الجزء الواقع في بؤرة حادة. عمق مجال ضحل يطمس الخلفية ليبرز العنصر الرئيسي.
فيديو وكيل ذاتيفيديو الذكاء الاصطناعي
وكيل ذكاء اصطناعي يخطط ويدير الإنتاج بأكمله — النص، والمشاهد، والصوت، والأفاتارات، والمونتاج — من موجز واحد بدل توليد كل مقطع على حدة.
لقطات بديلة (B-roll)فيديو
لقطات مساندة تُدرج فوق المشهد الرئيسي لإضافة سياق، أو توضيح نقطة، أو إخفاء قطْع.
لوح القصة (Storyboard)فيديو
تسلسل مخطّط من اسكتشات أو إطارات يوضح كل لقطة قبل إنتاج الفيديو أو توليده.
متعدد الوسائطالذكاء الاصطناعي
نموذج يفهم أو يولّد أكثر من نوع بيانات في آن — مثل النص والصورة والفيديو والصوت معًا.
مجموعة البياناتالذكاء الاصطناعي
مجموعة الأمثلة — فيديوهات، صور، نصوص — التي يُدرَّب عليها النموذج. جودتها وتنوعها يشكّلان ما يمكن للنموذج فعله.
مزامنة الشفاهفيديو الذكاء الاصطناعي
مطابقة حركة فم الشخصية أو الأفاتار مع الصوت المنطوق ليبدو وكأنه ينطق الكلمات فعلًا.
معدل الإطارات (FPS)فيديو
عدد الإطارات في الثانية — كم صورة ثابتة تُعرض كل ثانية. 24fps يعطي إحساسًا سينمائيًا، 30fps قياسي للويب، و60fps سلاسة فائقة للحركة والرياضة.
معدل البتفيديو
كمية البيانات المستخدمة لكل ثانية فيديو، تقاس بـ kbps أو Mbps. المعدل الأعلى يحافظ على تفاصيل أكثر لكنه يزيد حجم الملف.
مقياس التوجيه (CFG)الذكاء الاصطناعي
مدى التزام النموذج بأمرك النصي مقابل الارتجال. القيم الأعلى تلتزم أكثر بالكلمات؛ الأدنى تمنح النموذج حرية إبداعية أكبر.
نسبة الأبعادفيديو
النسبة بين عرض الإطار وارتفاعه — 16:9 (شاشة عريضة)، 9:16 (عمودي لـ Reels وTikTok)، أو 1:1 (مربّع). تحدد كيف يتناسب فيديوك مع كل منصة وشاشة.
نقطة حفظ (Checkpoint)الذكاء الاصطناعي
لقطة محفوظة لأوزان النموذج. غالبًا ما تُشارك كنموذج قابل للتنزيل لتشغيله.
نقل الأسلوبفيديو الذكاء الاصطناعي
تطبيق الأسلوب البصري لمرجعٍ ما على لقطاتك أو توليدك.
نموذج الانتشارالذكاء الاصطناعي
النهج السائد وراء صور وفيديو الذكاء الاصطناعي: يبدأ النموذج من ضوضاء عشوائية ويزيلها خطوة بخطوة حتى يظهر ناتج متماسك يطابق أمرك النصي.
نموذج تأسيسيالذكاء الاصطناعي
نموذج كبير عام الغرض مُدرَّب على بيانات واسعة يمكن تكييفه لمهام عديدة لاحقة.
نموذج عالمفيديو الذكاء الاصطناعي
ذكاء اصطناعي يبني محاكاة داخلية لكيفية سلوك المشاهد والكائنات والفيزياء، ما يساعده على توليد فيديو أطول وأكثر ترابطًا واتساقًا.
نموذج مفتوح الأوزانالذكاء الاصطناعي
نموذج تُنشر أوزانه ليتمكن أي شخص من تشغيله أو دراسته أو ضبطه دقيقًا (مثلًا على fal أو محليًا)، بعكس النموذج المغلق المتاح فقط عبر API.
هندسة الأوامر النصيةالذكاء الاصطناعي
صياغة الأوامر بحيث ينتج النموذج النتيجة المقصودة بثبات، بما في ذلك الموضوع، والأسلوب، وحركة الكاميرا، والمزاج.
GANالذكاء الاصطناعي
شبكة توليد خصمية — أسلوب أقدم يتنافس فيه مولّد وناقد. استُبدل إلى حد كبير بالانتشار للفيديو عالي الجودة.
HDR (النطاق الديناميكي العالي)فيديو
فيديو يحمل نطاقًا أوسع من السطوع والألوان مقارنة بالقياسي (SDR)، لواقعية أكبر في الإضاءات والظلال وتدرجات أغنى.
LoRAالذكاء الاصطناعي
تكيّف منخفض الرتبة — طريقة خفيفة لتعليم النموذج أسلوبًا أو شخصية أو مفهومًا جديدًا عبر ملف إضافي صغير بدل إعادة تدريب النموذج كاملًا.
LUT (جدول البحث)فيديو
إعداد مسبق يعيد تعيين الألوان لتطبيق مظهر محدد بنقرة واحدة، أو لتحويل اللقطات بين فضاءات لونية.
RLHFالذكاء الاصطناعي
التعلّم التعزيزي من تغذية راجعة بشرية — تدريب يستخدم تفضيلات الناس لمواءمة مخرجات النموذج مع ما يريده البشر فعلًا.

من الأمر النصي حتى الإخراج: لغة فيديو الذكاء الاصطناعي

صناعة الفيديو بالذكاء الاصطناعي تقع عند تقاطع عالمين — عقود من مفردات صناعة السينما والفيديو، ولغة تعلّم الآلة المتسارعة. هذا القاموس يجمع الاثنين، ويضيف المصطلحات الجديدة الخاصة بالفيديو التوليدي، لتقرأ أي أداة أو درس أو بطاقة نموذج بثقة.

ابدأ بالأساسيات: نسبة الأبعاد، والدقة، ومعدل الإطارات، وبرامج الترميز تقرر كيف يبدو فيديوك وأين يُعرض. ثم تأتي طبقة الذكاء الاصطناعي — النماذج، والانتشار، والأوامر النصية، والبذور، وLoRA تشكّل ما سيتم توليده. وأخيرًا خصائص فيديو الذكاء الاصطناعي — تحويل النص إلى فيديو، وتحويل الصورة إلى فيديو، ومزامنة الشفاه، والأفاتارات، والاتساق الزمني، ونماذج العوالم — لتصف ما يمكن للمولّدات فعله اليوم.

كل تعريف مكتوب بلغة مبسطة دون رياضيات. ابحث بالكلمة المفتاحية، رشّح حسب الموضوع، أو تصفّح أبجديًا — ثم طبّق المفردات في استوديو Vivideo.