
આજની આ ટેકનોલોજીની દુનિયામાં દરરોજ ઘણું અવનવું શોધતું રહે છે. આપણા વિચારોથી પણ આગળ જઈને હાલમાં ટેકનોલોજીનો વિકાસ થઇ રહ્યો છે. એવામાં ગૂગલે રોબોટ કંટ્રોલ માટે તેનું પ્રથમ વિઝન-લેંગ્વેજ-એક્શન (VLA) મોડલ પ્રદર્શિત કર્યું છે, જે રોબોટિક ડેટા અને સિમેન્ટીક અને વિઝ્યુઅલની સમજણ સાથે અનેક સામાન્ય આદેશો પર પણ કામ કરી શકે છે.
શું કરે છે આ મોડલ?
આમાં નવા આદેશોનું અર્થઘટન કરવું અને ઑબ્જેક્ટ કેટેગરીઝ અથવા ઉચ્ચ-સ્તરની વિગતો વિશે તર્ક જેવા પ્રાથમિક તર્કના આધારે યુઝર્સના આદેશોના પ્રમાણે કામ કરી શકે છે.
રોબોટિક ટ્રાન્સફોર્મર 2 શું છે?
રોબોટિક ટ્રાન્સફોર્મર 2 (RT-2)એ એક નવું વિઝન-લેંગ્વેજ-એક્શન (VLA) મોડલ છે જે વેબ અને રોબોટિક્સ ડેટા બંનેમાંથી શીખે છે અને આ જ્ઞાનને રોબોટિક નિયંત્રણ માટે સામાન્ય સૂચનાઓમાં અનુવાદિત કરે છે. RT-2 નો ફ્લેક્સીબલ અભિગમ રોબોટને વિવિધ કર્યો કરવા સક્ષમ બનાવે છે, ઉદાહરણ તરીકે ક્યુબ, અન્ય રમકડાને પસંદ કરવા માટે તેના આર્મ્સને કેવી રીતે કામ કરવું તેને સહ્લગ્ન બનાવે છે.
વ્યક્તિની જરૂરિયાતને સમજી કરશે કામ
એક અધિકારીના જણાવ્યા અનુસાર, ચેન-ઓફ-થોટ રિઝનિંગનો સમાવેશ કરવાથી RT-2ને બહુ-તબક્કાના અર્થપૂર્ણ તર્કની કામગીરી કરવાની મંજૂરી મળે છે, જેમ કે ઇમ્પ્રુવાઇઝ્ડ હેમર તરીકે કયા ઑબ્જેક્ટનો ઉપયોગ કરી શકાય છે અથવા થાકેલા વ્યક્તિ માટે કયા પ્રકારના એનર્જી ડ્રીંકની જરૂર છે તે નક્કી કરવું.
6,000 રોબોટિક ટ્રાયલ્સ બાદ બન્યું સફળ
આ મોડલ નવીનતમ રોબોટિક ટ્રાન્સફોર્મર 1 પર બનેલું છે જેને મલ્ટી-ટાસ્ક ડેમોસ્ટ્રેશન પર તાલીમ આપવામાં આવી હતી. ટીમે 6,000 રોબોટિક ટ્રાયલ્સ પર RT-2 મોડલ્સ પર શ્રેણીબદ્ધ કોન્ટીટેટીવ અને ક્વોલીટેટીવ પ્રયોગો કર્યા છે. RT-2 મોડલ દર્શાવે છે કે, વિઝન-લેંગ્વેજ મોડલ્સને શક્તિશાળી વિઝન-લેંગ્વેજ-એક્શન મોડલમાં રૂપાંતરિત કરી શકાય છે, જે રોબોટિક ડેટા સાથે VLM પૂર્વ-તાલીમને જોડીને રોબોટને સીધું નિયંત્રિત કરી શકે છે.
RT-2 શું છે?
Google DeepMindએ RT-2 એ હાલના VLM મોડલ્સ પર માત્ર એક સરળ અને અસરકારક ફેરફાર નથી, પરંતુ સામાન્ય હેતુના ભૌતિક રોબોટનું નિર્માણ દર્શાવે છે જે હાલની દુનિયામાં વિવિધ શ્રેણીના કાર્યો કરવા માટે તર્ક, સમસ્યાનું નિરાકરણ અને માહિતીનું અર્થઘટન કરી શકે છે.
from Science technology News - Gujarat Samachar : World's Leading Gujarati Newspaper https://ift.tt/768QOS9
0 Comments