નવી દિલ્હી: મેટા (અગાઉ ફેસબુક) એ જનરેટિવ આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI) મોડલ રજૂ કર્યું છે — “CM3leon” (કાચંડો જેવા ઉચ્ચારવામાં આવે છે), જે ટેક્સ્ટ-ટુ-ઇમેજ અને ઇમેજ-ટુ-ટેક્સ્ટ જનરેશન બંને કરે છે.
મેટાએ એક બ્લોગપોસ્ટમાં જણાવ્યું હતું કે, “CM3leon એ પ્રથમ મલ્ટિમોડલ મોડલ છે જેને માત્ર ટેક્સ્ટ-ઓન્લી લેંગ્વેજ મોડલમાંથી અનુકૂલિત રેસીપી સાથે પ્રશિક્ષિત કરવામાં આવે છે, જેમાં મોટા પાયે પુનઃપ્રાપ્તિ-વધારેલ પ્રી-ટ્યુનિંગ સ્ટેજ અને બીજા મલ્ટિટાસ્ક સુપરવાઇઝ્ડ ફાઇન-ટ્યુનિંગ (SFT) સ્ટેજનો સમાવેશ થાય છે.” શુક્રવારે.
CM3leon ની ક્ષમતાઓ સાથે, કંપનીએ કહ્યું કે ઇમેજ જનરેશન ટૂલ્સ વધુ સુસંગત ઇમેજરી ઉત્પન્ન કરી શકે છે જે ઇનપુટ પ્રોમ્પ્ટ્સને વધુ સારી રીતે અનુસરે છે. મેટા અનુસાર, CM3leonને અગાઉની ટ્રાન્સફોર્મર-આધારિત પદ્ધતિઓ કરતાં માત્ર પાંચ ગણી કમ્પ્યુટિંગ શક્તિ અને નાના તાલીમ ડેટાસેટની જરૂર છે.
cre ટ્રેન્ડિંગ વાર્તાઓ
જ્યારે સૌથી વધુ ઉપયોગમાં લેવાતા ઇમેજ જનરેશન બેન્ચમાર્ક (શૂન્ય-શૉટ MS-COCO) સાથે સરખામણી કરવામાં આવે છે, ત્યારે CM3Leon એ 4.88 નો FID (Frechet Inception Distance) સ્કોર હાંસલ કર્યો હતો, જે ટેક્સ્ટ-ટુ-ઇમેજ જનરેશનમાં નવી અત્યાધુનિક સ્થાપના કરી હતી અને Google ના ટેક્સ્ટ-ટુ-ઇમેજ મોડલ, પાર્ટીને પાછળ રાખી દે છે.
તદુપરાંત, ટેક જાયન્ટે કહ્યું કે CM3leon વિઝ્યુઅલ ક્વેશ્ચન એન્સરિંગ અને લોંગ-ફોર્મ કૅપ્શનિંગ જેવા વિઝન-લેંગ્વેજ કાર્યોની વિશાળ શ્રેણીમાં શ્રેષ્ઠ છે. માત્ર ત્રણ બિલિયન ટેક્સ્ટ ટોકન્સના ડેટાસેટ પર પ્રશિક્ષણ હોવા છતાં, CM3Leonનું શૂન્ય-શૉટ પ્રદર્શન મોટા ડેટાસેટ્સ પર પ્રશિક્ષિત મોટા મોડલ્સ સાથે અનુકૂળ સરખામણી કરે છે.
“ઉચ્ચ-ગુણવત્તાવાળા જનરેટિવ મોડલ્સ બનાવવાના ધ્યેય સાથે, અમે માનીએ છીએ કે વિવિધ કાર્યોમાં CM3leonનું મજબૂત પ્રદર્શન ઉચ્ચ-વફાદારી ઇમેજ જનરેશન અને સમજણ તરફનું એક પગલું છે,” મેટાએ જણાવ્યું હતું.
“CM3leon જેવા મોડલ આખરે મેટાવર્સમાં સર્જનાત્મકતા અને બહેતર એપ્લીકેશનને વધારવામાં મદદ કરી શકે છે. અમે મલ્ટિમોડલ લેંગ્વેજ મોડલ્સની સીમાઓ શોધવા અને ભવિષ્યમાં વધુ મોડલ બહાર પાડવા માટે આતુર છીએ,” તે ઉમેરે છે.