מדריך כללי ליצירת סרטונים עם AI — כל מה שצריך לדעת
כשהתחלתי ליצור סרטונים עם AI, חשבתי שזה כמו יצירת תמונות — רק עם תנועה. טעיתי לגמרי. וידאו AI הוא עולם שלם בפני עצמו, עם כללים משלו, ארכיטקטורה משלו, ומלכודות ייחודיות.
אחרי מאות סרטונים בכל הפלטפורמות המובילות — Runway, Kling, Sora, Veo ו-Minimax — בניתי מתודולוגיה שעובדת בכל מקום. במדריך הזה אני חולק את ארכיטקטורת 7 השכבות האוניברסלית, השוואה מפורטת בין כל הפלטפורמות, וטיפים שחוסכים שעות של ניסוי וטעייה.
מה זה כל הפלטפורמות?
יצירת סרטונים עם AI היא תהליך שבו מודלי Generative AI ממירים טקסט (ולפעמים תמונות ייחוס) לקליפ וידאו. בשונה מתמונות, כאן צריך לחשוב על זמן, תנועה, מצלמה, פיזיקה, ואודיו — כל אלמנט מוסיף שכבת מורכבות.
בשנת 2026, 5 פלטפורמות מובילות את השוק, כל אחת עם חוזקות שונות:
- Runway Gen-4 — שליטה בתנועת מצלמה (Director Mode)
- Kling 3.0 — פיזיקה מדויקת ותנועה ריאליסטית
- Sora 2 — סטוריבורד קולנועי ודיאלוג
- Veo 3.1 — אודיו מקורי (הפלטפורמה היחידה)
- Minimax Hailuo 2.3 — הבעות פנים ותנועת גוף
המבנה המושלם לפרומפט
ארכיטקטורת 7 השכבות האוניברסלית — המבנה שעובד בכל פלטפורמה:
- Shot Type — סוג השוט: close-up, medium, wide, extreme close-up, establishing shot
- Subject — הנושא המרכזי: מי או מה נמצא בפריים, עם תיאור מפורט
- Action / Motion — מה קורה: פעולות, תנועות, אינטראקציות
- Camera Movement — תנועת מצלמה: pan, tilt, dolly, tracking, crane, orbital, static
- Environment — סביבה ומיקום: interior/exterior, זמן ביום, מזג אוויר, פרטי רקע
- Visual Style — סגנון ואסתטיקה: תאורה, צבעים, עומק שדה, film grain, אסתטיקה כללית
- Audio (כשרלוונטי) — סאונד: דיאלוג, SFX, אמביינט, מוזיקה
לא כל שכבה חייבת להופיע בכל פרומפט — אבל ככל שתכלול יותר שכבות, התוצאה תהיה מדויקת ומקצועית יותר.
טבלת השוואה בין הפלטפורמות
| תכונה | Runway Gen-4 | Kling 3.0 | Sora 2 | Veo 3.1 | Minimax 2.3 |
|---|---|---|---|---|---|
| משך מקסימלי | 10s | 15s | 20s | 8s | 10s |
| רזולוציה מקסימלית | 1080p | 4K | 1080p | 4K | 1080p |
| אודיו מקורי | - | בסיסי | - | מלא | - |
| Negative prompt | - | נתמך | - | - | - |
| תנועת מצלמה | Director Mode | טקסט | טקסט | טקסט | [סוגריים] |
| חוזקה מרכזית | שליטת מצלמה | פיזיקה | סטוריבורד | אודיו | הבעות פנים |
| תמונת ייחוס | Image-to-Video | Image + Motion Brush | Character Refs | עד 4 Ingredients | Image-to-Video |
כללים קריטיים
- 1.תמיד התחל עם סוג השוט — זו האינפורמציה הראשונה שכל מודל וידאו צריך. Close-up, medium, wide — זה קובע את כל הקומפוזיציה.
- 2.מקד כל סרטון בפעולה אחת מרכזית — ב-5-10 שניות אין מקום ל-5 אירועים. פעולה אחת ברורה עם ניואנסים עדיפה על 5 פעולות שטחיות.
- 3.תאר תנועת מצלמה במונחים מקצועיים — pan, tilt, dolly, tracking, crane, orbital. מונחים קולנועיים מתורגמים טוב יותר מתיאורים כלליים.
- 4.כלול שכבת סגנון ואסתטיקה — 'cinematic', 'documentary', 'commercial'. ללא סגנון, כל מודל בוחר ברירת מחדל שלו שנראית גנרית.
- 5.התאם את הפרומפט לפלטפורמה — Runway רוצה ניסוח חיובי בלבד, Kling אוהב פיזיקה, Sora רוצה סטוריבורד, Veo חייב Audio block, ו-Minimax משתמש ב-[סוגריים].
- 6.משך סרטון צריך להתאים למורכבות — שוט סטטי ב-4-5 שניות, סצנה עם תנועה ב-8-10, סיפור עם מעבר ב-15-20 שניות.
דוגמאות מעשיות
Extreme close-up, slow orbit around product. A luxury watch resting on dark slate stone. Light catching the sapphire crystal face, reflections moving as camera orbits. Single dramatic side light, deep shadows. Black background, minimal. Product commercial aesthetic, 4K sharp, shallow depth of field.
7 שכבות בפעולה: Shot (extreme close-up) → Subject (watch) → Action (light catching crystal) → Camera (slow orbit) → Environment (dark slate) → Style (commercial, 4K). ללא Audio כי זה שוט מוצר שקט. עובד בכל פלטפורמה.
Wide establishing shot, static camera. A thunderstorm approaching over golden wheat fields. Dark clouds rolling in from the horizon, lightning flickering in the distance. Wind bending the wheat in waves. Dramatic landscape photography, high dynamic range, deep golden and storm gray palette. Audio — Dialogue: None. SFX: Distant thunder rumbles, wheat stalks rustling. Ambient: Strong wind, building intensity. Music: No music, nature sounds only.
סצנת טבע שמנצלת את ייחודיות Veo — האודיו הופך שוט טבע טוב לחוויה סנסורית מלאה. הרעמים הרחוקים והרוח יוצרים אווירה שאי אפשר להשיג בפלטפורמות אחרות.
[Push in slowly]. Close-up of a young man receiving exam results on his laptop screen. His face transitions from anxious anticipation — biting his lower lip, eyes scanning rapidly — to overwhelming relief — his shoulders drop, he exhales deeply, eyes closing, then opening with a wide genuine smile. His hand comes up to cover his mouth. Room with desk lamp creating warm side light. Authentic and emotional.
סצנה שמנצלת את החוזקה של Minimax — מעבר רגשי מורכב עם micro-expressions מפורטות. [Push in slowly] מתקרב לפנים בדיוק ברגע שהרגש מתגלה.
A slow aerial glide over a mirror-still alpine lake at dawn as the first rays of golden sunlight crest a snow-capped mountain ridge, painting the water in streaks of rose and amber while thin wisps of morning mist curl off the glassy surface and drift between dark green pine trees lining the shore, a lone wooden canoe resting motionless at a weathered dock, the entire scene bathed in soft ethereal light with a 35mm lens and gentle film grain.
דוגמה מקטגוריית landscape — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A rain-soaked city intersection at midnight gleams under the fractured light of neon signs reflected in deep puddles, taxis and buses crawling through the downpour as pedestrians clutch umbrellas and dash between awnings, steam rising from a manhole cover into the cold air mixing with the warm glow of a ramen shop doorway, shot low at street level with a wide anamorphic lens capturing streaking headlights and the kinetic energy of urban life in the rain.
דוגמה מקטגוריית street — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
An intimate close-up of an elderly woman with deep smile lines and silver hair swept into a loose bun, sitting beside a lace-curtained window as soft afternoon light falls across her weathered hands clasped around a porcelain teacup, her eyes crinkling warmly as a gentle smile spreads across her face, dust motes drifting lazily through the golden light beam, filmed with an 85mm portrait lens at a wide aperture creating a creamy bokeh of the sunlit garden visible beyond the glass.
דוגמה מקטגוריית portrait — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A powerful black horse gallops along the edge of the surf at golden hour, its rider crouched low in the saddle with a dark cloak billowing behind them, hooves kicking up explosions of wet sand and seawater that hang suspended in the warm backlight as each stride sends spray arcing into the air, waves rolling in from the right crashing into white foam, the horizon ablaze with deep orange and purple, captured with a long telephoto lens compressing the layers of horse, surf, and sunset into a single dramatic plane.
דוגמה מקטגוריית action — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A slow tracking shot drifts through a dense bamboo forest shrouded in heavy morning fog, impossibly tall green stalks disappearing into the white void above, droplets of condensation sliding down the smooth surfaces and falling in slow motion to the mossy ground below, a narrow stone path winding into the mist ahead, shafts of diffused pale light breaking through gaps in the canopy creating soft volumetric beams, the atmosphere thick and dreamlike with muted emerald and jade tones.
דוגמה מקטגוריית nature — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A lone ballerina in a faded pink leotard and worn pointe shoes practices a slow adagio in an empty rehearsal studio with scuffed wooden floors and a wall of mirrors, her reflection doubling every movement as she extends one leg into a perfect arabesque, arms floating upward with effortless control, late afternoon light streaming through tall industrial windows casting long golden rectangles across the floor and her silhouette, dust rising from each soft landing, the silence broken only by the creak of the floorboards, filmed on 50mm with shallow depth of field.
דוגמה מקטגוריית action — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A vibrant overhead tracking shot glides above open burlap sacks overflowing with pyramids of saffron gold and paprika red and turmeric orange in a narrow Marrakech souk, a merchant in a white djellaba scooping crimson powder into a brass scale, sunlight piercing through a slatted wooden roof creating zebra stripes of light and shadow across the kaleidoscope of color, hands reaching in to feel textures, aromatic dust floating in the beams, filmed with a wide 24mm lens capturing the sensory overload of the spice market.
דוגמה מקטגוריית street — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A diver in a black wetsuit glides beside a massive whale shark in crystal-clear tropical water, the enormous spotted creature moving with slow prehistoric grace as filtered sunlight penetrates from above in shifting columns of aquamarine and jade, the diver reaching out a hand that looks impossibly small against the shark's enormous pectoral fin, tiny remora fish clinging to the spotted grey skin, the blue abyss falling away beneath them into darkness, captured with an underwater wide-angle lens emphasizing the vast scale difference.
דוגמה מקטגוריית nature — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A sweeping aerial pan across a futuristic metropolis at sunset where towering glass spires catch the dying amber light and holographic billboards shimmer between the structures, flying vehicles tracing glowing blue trails through the warm air between buildings, a monorail curving silently around a central tower, the sky painted in gradients of coral and violet fading into deep indigo above, street level far below alive with pedestrian movement and neon signage, shot on an anamorphic lens with cinematic flares and Blade Runner atmosphere.
דוגמה מקטגוריית sci-fi — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A boy around six with sun-bleached hair and sandy swim trunks crouches at the waterline on a wide golden beach, carefully patting wet sand into a lopsided tower on an elaborate sandcastle, his tongue poking out the corner of his mouth in concentration as a small wave rushes in and laps at the castle moat sending tiny walls crumbling, his eyes widening before he scrambles to rebuild with urgent cupped handfuls, warm late-afternoon light painting everything in honeyed tones, an 85mm lens throwing the sparkling ocean into creamy bokeh behind him.
דוגמה מקטגוריית narrative — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A hand breaks a thick bar of dark Belgian chocolate in extreme close-up and slow motion, the clean snap sending tiny fragments and cocoa dust exploding outward into warm directional light, revealing the smooth glossy interior with visible layers and a swirl of caramel stretching between the halves, the broken surface catching highlights like polished mahogany, a curl of steam rising from a porcelain cup of hot chocolate in soft focus behind, the entire composition on dark slate with moody chiaroscuro lighting and macro lens detail.
דוגמה מקטגוריית commercial — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A couple walks hand in hand along a winding trail through a forest ablaze with autumn color, crimson maples and golden oaks arching overhead creating a cathedral of warm light, fallen leaves carpeting the path in amber and rust, the woman in a cream cable-knit sweater leaning into the man's shoulder as he points upward at something through the canopy, sunlight filtering through the remaining leaves in dappled patterns across their faces, a gentle breeze sending a flurry of leaves spiraling down around them, captured at eye level with a 50mm lens and the soft warmth of expired Kodak film stock.
דוגמה מקטגוריית narrative — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
A street violinist in a long dark coat stands on a cobblestone corner beneath a flickering gas lamp at dusk, drawing the bow across the strings with eyes closed and head tilted into the instrument, the melody seeming to pull passersby to slow their pace and gather, warm amber lamplight catching the polished wood of the violin and the musician's weathered face, breath visible in the cold air mixing with the soft halo of the lamp, the surrounding buildings fading into blue-grey twilight, filmed with an 85mm lens creating a shallow plane of focus that isolates the performer from the hushed audience.
דוגמה מקטגוריית music-video — הפרומפט מדגים את הסינטקס והמבנה האופטימלי לפלטפורמה.
טעויות נפוצות
שימוש באותו פרומפט בכל הפלטפורמות — copy-paste ללא התאמה
התאמה לפלטפורמה: הוספת [סוגריים] ל-Minimax, Audio block ל-Veo, negative prompt ל-Kling, ניסוח חיובי ל-Runway
כל פלטפורמה מפרסרת פרומפטים אחרת. פרומפט גנרי עובד 'בסדר' בכולן אבל לא מנצל אף חוזקה. התאמה ספציפית נותנת תוצאה טובה פי 3.
תיאור ארוע שלם ב-5 שניות: 'A car race starts, crashes happen, a winner crosses the finish line'
מיקוד ברגע אחד: 'Close-up of a race car wheel spinning, gravel flying, camera tracking the tire at ground level'
5 שניות = רגע אחד. תחשוב על שוט בסרט — לא על סיפור שלם. בחר את הרגע הכי ויזואלי ותן לו את כל תשומת הלב.
לא לציין תנועת מצלמה — לסמוך על ברירת מחדל של הפלטפורמה
תמיד לבחור במפורש — 'static camera' או 'slow dolly in' או '[Tracking shot]'
ללא הנחיית מצלמה, כל מודל בוחר תנועה אקראית — ולפעמים זה תנועה מוזרה שהורסת את הסצנה. גם 'static camera' היא בחירה מכוונת שכדאי לכתוב.
1. Subject: a woman sitting by a window 2. Lighting: afternoon sun 3. Action: she drinks tea 4. Mood: peaceful 5. Camera: close-up portrait lens
An intimate close-up of an elderly woman with deep smile lines and silver hair swept into a loose bun, sitting beside a lace-curtained window as soft afternoon light falls across her weathered hands clasped around a porcelain teacup, her eyes crinkling warmly as a gentle smile spreads across her face, dust motes drifting lazily through the golden light beam, filmed with an 85mm portrait lens at a wide aperture creating a creamy bokeh.
General video prompts must be a single flowing paragraph, never numbered sections or bullet points. Most video models parse a continuous prose description — numbered lists break the prompt into disconnected fragments the model processes unevenly.
A horse runs on a beach at sunset.
A powerful black horse gallops along the edge of the surf at golden hour, its rider crouched low in the saddle with a dark cloak billowing behind them, hooves kicking up explosions of wet sand and seawater that hang suspended in the warm backlight, waves crashing into white foam, the horizon ablaze with deep orange and purple, captured with a long telephoto lens.
Too short — general video prompts need 30-80 words to cover all 7 layers: subject, action, environment, lighting, mood, camera, and style. Under 20 words produces generic, under-directed results.
A person walks down a street in a city, there are buildings and cars and people around them.
A rain-soaked city intersection at midnight gleams under neon signs reflected in deep puddles, taxis crawling through the downpour as pedestrians clutch umbrellas and dash between awnings, steam rising from a manhole cover mixing with the warm glow of a ramen shop doorway, shot low at street level with a wide anamorphic lens capturing streaking headlights and kinetic urban energy.
Missing lighting, mood, and camera/lens information. General prompts must include lighting conditions (time of day, quality of light), emotional atmosphere, and a lens or style reference. Without them, the model defaults to flat, generic rendering.
תיאור של סצנה עם אישה יושבת ליד חלון ושותה תה בשקט ובשלווה
An intimate close-up of an elderly woman with deep smile lines and silver hair, sitting beside a lace-curtained window as soft afternoon light falls across her hands clasped around a porcelain teacup, filmed with an 85mm portrait lens creating creamy bokeh of the sunlit garden beyond the glass.
General video prompts must always be written in English. Hebrew descriptions will not be parsed correctly by any current video generation model. Translate the concept into vivid English prose.
💡 טיפ אישי
הטיפ הכי חשוב שלי אחרי מאות סרטונים: תחשוב על AI Video כמו על צילום סטילס עם מימד זמן. כל פרומפט טוב מתחיל בשאלה: 'מה הפריים הראשון שאני רוצה לראות?' ואז: 'מה משתנה ב-5-10 השניות הבאות?' אם אתה יודע את הפריים הראשון ואת השינוי — יש לך את הפרומפט.
שאלות נפוצות
איזו פלטפורמה הכי טובה למתחילים?▾
איזו פלטפורמה לבחור לפי סוג הסרטון?▾
האם אפשר לחבר סרטונים מפלטפורמות שונות?▾
מה משך הסרטון האידיאלי?▾
מה ההבדל בין פרומפט לתמונה לפרומפט לוידאו?▾
רוצה ש-Peroot יכתוב את הפרומפט המושלם עבורך?
נסה עכשיו ב-Peroot