Lightricks a lansat miercuri LTX-2, prezentându-l ca primul model complet open-source de bază AI pentru video, capabil să genereze conținut sincronizat audio și video la calitate profesională. Sistemul produce videoclipuri native la rezoluție 4K cu 50 de cadre pe secundă pentru secvențe de până la 10 secunde, funcționând eficient pe plăci grafice de consum.
Compania cu sediul în Ierusalim, cunoscută mai ales pentru aplicația de editare selfie Facetune, poziționează LTX-2 ca o inovație în AI creativă, care face legătura între tehnologia experimentală și instrumentele gata de producție. Potrivit Lightricks, modelul poate genera un videoclip Full HD de șase secunde în aproximativ cinci secunde, depășind semnificativ concurenți precum Sora 2 de la OpenAI, care de obicei necesită unul până la două minute pentru rezultate similare.
Viteza și eficiența determină diferențierea pe piață
Principalul avantaj competitiv al LTX-2 constă în viteza de procesare și eficiența costurilor. Compania susține că modelul oferă rezultate la nivel profesional cu până la 50% costuri de calcul mai mici față de sistemele concurente, datorită stivei sale de inferență multi-GPU. Această eficiență se extinde și la cerințele hardware, deoarece modelul rulează pe GPU-uri de tip consumer, nefiind necesară o infrastructură la nivel enterprise.
„Modelele de difuzie au ajuns într-un punct în care nu mai simulează doar producția – ele SUNT producția,” a declarat Zeev Farbman, co-fondator și CEO al Lightricks. „LTX-2 reprezintă această schimbare: cel mai complet motor creativ pe care l-am construit, reunind audio și video sincronizat, fidelitate 4K, capacitate pentru conținut lung și eficiență radicală într-un singur sistem deschis, pregătit pentru producție.”
Modelul oferă trei niveluri de preț: Fast, începând de la 0,04 USD pe secundă pentru iterații rapide, Pro la 0,08 USD pe secundă pentru lucrări zilnice de producție, și Ultra la 0,16 USD pe secundă pentru rezultate cu fidelitate maximă, rezoluție 4K și audio sincronizat. Prețurile variază în funcție de rezoluție, de la 720p la 4K, și dacă este inclusă generarea de audio.
Strategia Open Source provoacă liderii din industrie
Abordarea open-source a LTX-2 o diferențiază într-o piață dominată de modele proprietare dezvoltate de marile companii tehnologice. În timp ce Sora 2 de la OpenAI și Veo 3.1 de la Google au atras atenția datorită capabilităților lor, ambele rămân sisteme închise, cu acces limitat. Componentele de bază ale LTX-2 sunt deja disponibile pe GitHub, iar publicarea completă a greutăților modelului și a seturilor de date pentru antrenament este programată pentru această toamnă.
Generarea sincronizată audio-video de către model reprezintă un avans tehnic față de sistemele care necesită crearea separată a sunetului și integrare ulterioară în post-producție. LTX-2 creează simultan imagini, mișcare, dialog, sunet ambiental și muzică, într-un singur proces, eficientizând fluxurile de lucru creative pentru cineaști și creatorii de conținut.
Accesul API pentru LTX-2 este implementat în prezent pentru partenerii early adopters, prin integrarea cu platforme precum Fal, Replicate și ComfyUI. Sistemul este, de asemenea, accesibil prin platforma LTX Studio de la Lightricks, iar o disponibilitate mai largă pe piață este planificată pentru mai târziu în acest an. Fondată în 2013, Lightricks a atras finanțări în valoare de 335 de milioane de dolari și a atins o evaluare de 1,8 miliarde de dolari în 2021.

