મેટા ટેક્સ્ટ, ઈમેજીસ માટે જનરેટિવ AI મોડલ ‘CM3leon’ રજૂ કરે છે | ટેકનોલોજી સમાચાર

Spread the love

નવી દિલ્હી: મેટા (અગાઉ ફેસબુક) એ જનરેટિવ આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI) મોડલ રજૂ કર્યું છે — “CM3leon” (કાચંડો જેવા ઉચ્ચારવામાં આવે છે), જે ટેક્સ્ટ-ટુ-ઇમેજ અને ઇમેજ-ટુ-ટેક્સ્ટ જનરેશન બંને કરે છે.

મેટાએ એક બ્લોગપોસ્ટમાં જણાવ્યું હતું કે, “CM3leon એ પ્રથમ મલ્ટિમોડલ મોડલ છે જેને માત્ર ટેક્સ્ટ-ઓન્લી લેંગ્વેજ મોડલમાંથી અનુકૂલિત રેસીપી સાથે પ્રશિક્ષિત કરવામાં આવે છે, જેમાં મોટા પાયે પુનઃપ્રાપ્તિ-વધારેલ પ્રી-ટ્યુનિંગ સ્ટેજ અને બીજા મલ્ટિટાસ્ક સુપરવાઇઝ્ડ ફાઇન-ટ્યુનિંગ (SFT) સ્ટેજનો સમાવેશ થાય છે.” શુક્રવારે.

CM3leon ની ક્ષમતાઓ સાથે, કંપનીએ કહ્યું કે ઇમેજ જનરેશન ટૂલ્સ વધુ સુસંગત ઇમેજરી ઉત્પન્ન કરી શકે છે જે ઇનપુટ પ્રોમ્પ્ટ્સને વધુ સારી રીતે અનુસરે છે. મેટા અનુસાર, CM3leonને અગાઉની ટ્રાન્સફોર્મર-આધારિત પદ્ધતિઓ કરતાં માત્ર પાંચ ગણી કમ્પ્યુટિંગ શક્તિ અને નાના તાલીમ ડેટાસેટની જરૂર છે.

cre ટ્રેન્ડિંગ વાર્તાઓ

જ્યારે સૌથી વધુ ઉપયોગમાં લેવાતા ઇમેજ જનરેશન બેન્ચમાર્ક (શૂન્ય-શૉટ MS-COCO) સાથે સરખામણી કરવામાં આવે છે, ત્યારે CM3Leon એ 4.88 નો FID (Frechet Inception Distance) સ્કોર હાંસલ કર્યો હતો, જે ટેક્સ્ટ-ટુ-ઇમેજ જનરેશનમાં નવી અત્યાધુનિક સ્થાપના કરી હતી અને Google ના ટેક્સ્ટ-ટુ-ઇમેજ મોડલ, પાર્ટીને પાછળ રાખી દે છે.

તદુપરાંત, ટેક જાયન્ટે કહ્યું કે CM3leon વિઝ્યુઅલ ક્વેશ્ચન એન્સરિંગ અને લોંગ-ફોર્મ કૅપ્શનિંગ જેવા વિઝન-લેંગ્વેજ કાર્યોની વિશાળ શ્રેણીમાં શ્રેષ્ઠ છે. માત્ર ત્રણ બિલિયન ટેક્સ્ટ ટોકન્સના ડેટાસેટ પર પ્રશિક્ષણ હોવા છતાં, CM3Leonનું શૂન્ય-શૉટ પ્રદર્શન મોટા ડેટાસેટ્સ પર પ્રશિક્ષિત મોટા મોડલ્સ સાથે અનુકૂળ સરખામણી કરે છે.

“ઉચ્ચ-ગુણવત્તાવાળા જનરેટિવ મોડલ્સ બનાવવાના ધ્યેય સાથે, અમે માનીએ છીએ કે વિવિધ કાર્યોમાં CM3leonનું મજબૂત પ્રદર્શન ઉચ્ચ-વફાદારી ઇમેજ જનરેશન અને સમજણ તરફનું એક પગલું છે,” મેટાએ જણાવ્યું હતું.

“CM3leon જેવા મોડલ આખરે મેટાવર્સમાં સર્જનાત્મકતા અને બહેતર એપ્લીકેશનને વધારવામાં મદદ કરી શકે છે. અમે મલ્ટિમોડલ લેંગ્વેજ મોડલ્સની સીમાઓ શોધવા અને ભવિષ્યમાં વધુ મોડલ બહાર પાડવા માટે આતુર છીએ,” તે ઉમેરે છે.

Leave a Reply

Your email address will not be published. Required fields are marked *