“जगातील सर्वात हुशार” ग्रोक 3 ची चाचणी घेत आहे

एआयपीयू वॉटन ग्रुप (1)

परिचय

आपणास असे वाटते की ग्रोक 3 हा पूर्व-प्रशिक्षित मॉडेलचा "एंडपॉईंट" असेल?

एलोन कस्तुरी आणि झई टीमने लाइव्हस्ट्रीम दरम्यान ग्रोक, ग्रोक 3 ची नवीनतम आवृत्ती अधिकृतपणे सुरू केली. या घटनेच्या अगोदर, कस्तुरीच्या 24/7 प्रमोशनल हायपसह संबंधित संबंधित माहितीच्या महत्त्वपूर्ण प्रमाणात, जीआरओके 3 साठी जागतिक अपेक्षा अभूतपूर्व पातळीवर वाढवल्या. फक्त एका आठवड्यापूर्वी, कस्तुरीने एका लाइव्हस्ट्रीम दरम्यान आत्मविश्वासाने सांगितले की दीपसेक आर 1 वर टिप्पणी देताना, "झई एक चांगले एआय मॉडेल सुरू करणार आहे." थेट सादर केलेल्या आकडेवारीवरून, जीआरओके 3 ने गणित, विज्ञान आणि प्रोग्रामिंगच्या बेंचमार्कमधील सर्व सध्याच्या मुख्य प्रवाहातील मॉडेल्सला मागे टाकले आहे, कस्तुरी देखील असा दावा करीत आहे की स्पेसएक्सच्या मार्स मिशनशी संबंधित संगणकीय कार्यांसाठी ग्रोक 3 वापरला जाईल, "तीन वर्षांच्या आत नोबेल प्राइज स्तरावरील ब्रेकथ्रू". तथापि, हे सध्या कस्तुरीचे म्हणणे आहेत. लॉन्चनंतर, मी ग्रोक 3 च्या नवीनतम बीटा आवृत्तीची चाचणी केली आणि मोठ्या मॉडेल्ससाठी क्लासिक युक्ती प्रश्न विचारला: "जे मोठे आहे, 9.11 किंवा 9.9?" दुर्दैवाने, कोणत्याही पात्रता किंवा चिन्हांशिवाय, तथाकथित स्मार्ट ग्रोक 3 अद्याप या प्रश्नाचे उत्तर योग्यरित्या करू शकत नाही. ग्रोक 3 प्रश्नाचा अर्थ अचूकपणे ओळखण्यात अयशस्वी.

 

या चाचणीने बर्‍याच मित्रांकडून त्वरेने लक्ष वेधले आणि योगायोगाने, परदेशात अशा प्रकारच्या विविध चाचण्यांनी "पिसाच्या झुकलेल्या टॉवरमधून प्रथम कोणते बॉल फॉल्स" सारख्या मूलभूत भौतिकशास्त्र/गणिताच्या प्रश्नांसह संघर्ष करीत असल्याचे दर्शविले आहे. अशाप्रकारे, त्यास विनोदीपणे "साध्या प्रश्नांची उत्तरे देण्यास तयार नसलेले एक अलौकिक बुद्धिमत्ता" असे लेबल लावले गेले आहे.

640

ग्रोक 3 चांगले आहे, परंतु ते आर 1 किंवा ओ 1-प्रो पेक्षा चांगले नाही.

सराव मध्ये अनेक सामान्य ज्ञान चाचण्यांवर ग्रोक 3 ने "अपयश" अनुभवी केले. एक्सएआय लॉन्च इव्हेंट दरम्यान, कस्तुरीने जीआरओके 3 वापरुन एक्झीले 2 च्या गेम मार्गाच्या वर्णांचे विश्लेषण करण्यासाठी आणि प्रभावांचे विश्लेषण करण्यासाठी प्रात्यक्षिक केले, ज्याचा त्याने बर्‍याचदा खेळण्याचा दावा केला, परंतु जीआरओके 3 द्वारे प्रदान केलेली बहुतेक उत्तरे चुकीची होती. लाइव्हस्ट्रीम दरम्यान कस्तुरीला हा स्पष्ट मुद्दा दिसला नाही.

 

या चुकांमुळे केवळ परदेशी नेटिझन्सना गेमिंगमध्ये "पर्याय शोधण्यासाठी" कस्तुरीची थट्टा करण्यासाठी पुढील पुरावा मिळाला नाही तर व्यावहारिक अनुप्रयोगांमधील जीआरओके 3 च्या विश्वासार्हतेबद्दलही महत्त्वपूर्ण चिंता निर्माण झाली. अशा "अलौकिक बुद्धिमत्तेसाठी" त्याच्या वास्तविक क्षमतेची पर्वा न करता, मार्स एक्सप्लोरेशन कार्ये यासारख्या अत्यंत जटिल अनुप्रयोग परिस्थितींमध्ये त्याची विश्वासार्हता संशयास्पद आहे.

 

सध्या, बर्‍याच परीक्षकांना ज्यांना ग्रोक 3 आठवड्यांपूर्वी प्रवेश मिळाला आहे आणि ज्यांनी काल काही तास मॉडेल क्षमतांची चाचणी केली, सर्व एक सामान्य निष्कर्ष दर्शवितात: "जीआरओके 3 चांगले आहे, परंतु ते आर 1 किंवा ओ 1-प्रो पेक्षा चांगले नाही."

640 (1)

"एनव्हीडिया व्यत्यय आणण्याबद्दल" एक गंभीर दृष्टीकोन

रिलीझ दरम्यान अधिकृतपणे सादर केलेल्या पीपीटीमध्ये, GROK3 चॅटबॉट रिंगणात "खूपच पुढे" असल्याचे दर्शविले गेले, परंतु या चतुराईने ग्राफिक तंत्र वापरले गेले: लीडरबोर्डवरील अनुलंब अक्ष केवळ 1400-1300 स्कोअर श्रेणीतील परिणाम दर्शविते, ज्यामुळे चाचणी निकालांमध्ये मूळ 1% फरक या प्रेझेंटेशनमध्ये अपवादात्मक दिसून येतो.

640

वास्तविक मॉडेल स्कोअरिंगच्या निकालांमध्ये, जीआरओके 3 दीपसेक आर 1 आणि जीपीटी -4.0 च्या तुलनेत फक्त 1-2% पुढे आहे, जे व्यावहारिक चाचण्यांमधील बर्‍याच वापरकर्त्यांच्या अनुभवांशी संबंधित आहे ज्यात "काही फरक नाही." ग्रोक 3 केवळ त्याच्या उत्तराधिकारी 1%-2%पेक्षा जास्त आहे.

640

जरी जीआरओके 3 ने सध्या सार्वजनिकपणे चाचणी केलेल्या सर्व मॉडेल्सपेक्षा जास्त गुण मिळवले आहेत, परंतु बरेचजण हे गंभीरपणे घेत नाहीत: शेवटी, झाईवर यापूर्वी ग्रोक 2 युगात "स्कोअर मॅनिपुलेशन" केल्याबद्दल टीका केली गेली आहे. लीडरबोर्डने उत्तर लांबीच्या शैलीला दंड आकारला म्हणून, स्कोअर मोठ्या प्रमाणात कमी झाले, "उच्च स्कोअरिंग परंतु कमी क्षमता" या घटनेवर अनेकदा टीका करण्यासाठी उद्योगातील आघाडीचे अंतर्गत लोक.

 

लीडरबोर्ड "मॅनिपुलेशन" किंवा स्पष्टीकरणांमध्ये डिझाइन युक्त्यांद्वारे, ते मॉडेल क्षमतांमध्ये "पॅक अग्रगण्य" या कल्पनेने झई आणि कस्तुरीचे वेध प्रकट करतात. कस्तुरीला या मार्जिनसाठी एक मोठी किंमत दिली: प्रक्षेपण दरम्यान, त्याने 200,000 एच 100 जीपीयू (लाइव्हस्ट्रीम दरम्यान "100,000 पेक्षा जास्त" दावा करणे) आणि 200 दशलक्ष तासांचा एकूण प्रशिक्षण वेळ मिळविण्याचा अभिमान बाळगला. यामुळे काहींनी असा विश्वास ठेवला की ते जीपीयू उद्योगासाठी आणखी एक महत्त्वपूर्ण वरदान दर्शविते आणि या क्षेत्रावर दीपसेकच्या परिणामाचा "मूर्ख" म्हणून विचार करतात. उल्लेखनीय म्हणजे, काहींचा असा विश्वास आहे की संपूर्ण संगणकीय शक्ती मॉडेल प्रशिक्षणाचे भविष्य असेल.

 

तथापि, काही नेटिझन्सने दीपसेक व्ही 3 तयार करण्यासाठी 2000 एच 800 जीपीयूच्या वापराची तुलना केली, जी ग्रोक 3 चा वास्तविक प्रशिक्षण उर्जा वापर व्ही 3 च्या तुलनेत 263 पट आहे. दीपसेक व्ही 3 मधील अंतर, ज्याने 1402 गुण मिळवले आणि जीआरओके 3 फक्त 100 गुणांच्या खाली आहे. या डेटाच्या प्रकाशनानंतर, बर्‍याच जणांना पटकन कळले की "जगातील सर्वात मजबूत" म्हणून ग्रोक 3 च्या शीर्षकामागील एक स्पष्ट सीमान्त उपयुक्तता प्रभाव आहे - मोठ्या मॉडेल्सच्या मजबूत कामगिरीमुळे कमी होणारी परतावा दर्शविण्यास सुरुवात झाली आहे.

640 (2)

जरी "उच्च स्कोअरिंग परंतु कमी क्षमता" सह, जीआरओके 2 मध्ये वापरास समर्थन देण्यासाठी एक्स (ट्विटर) प्लॅटफॉर्मवरील उच्च-गुणवत्तेच्या प्रथम-पक्षाचा डेटा होता. तथापि, जीआरओके 3 च्या प्रशिक्षणात, झईने नैसर्गिकरित्या ओपनईला सामोरे जाणा "्या" कमाल मर्यादा "सहन केले - प्रीमियम प्रशिक्षण डेटाचा अभाव मॉडेलच्या क्षमतेची सीमांत उपयुक्तता वेगवानपणे उघडकीस आणते.

 

जीआरओके 3 आणि कस्तुरीचे विकसक कदाचित या गोष्टींना खोलवर समजून घेतात आणि ओळखतात, म्हणूनच मस्कने सोशल मीडियावर सतत उल्लेख केला आहे की वापरकर्त्यांनी आता अनुभवत असलेली आवृत्ती "अद्याप फक्त बीटा" आहे आणि "संपूर्ण आवृत्ती येत्या काही महिन्यांत रिलीज होईल." कस्तुरींनी ग्रोक 3 च्या उत्पादन व्यवस्थापकाच्या भूमिकेकडे दुर्लक्ष केले आहे, असे सूचित करतात की टिप्पण्या विभागात आलेल्या विविध विषयांवर वापरकर्ते अभिप्राय प्रदान करतात.

 

तरीही, एका दिवसातच, ग्रोक 3 च्या कामगिरीने मजबूत मोठ्या मॉडेल्सना प्रशिक्षण देण्यासाठी "भव्य संगणकीय स्नायू" वर अवलंबून राहण्याच्या आशेने निःसंशयपणे अलार्म वाढविला: सार्वजनिकपणे उपलब्ध मायक्रोसॉफ्ट माहितीच्या आधारे, ओपनईच्या जीपीटी -4 मध्ये जीपीटी -3 च्या दहापेक्षा दहा वेळा पॅरामीटर आकार 1.8 ट्रिलियन पॅरामीटर्स आहे. अफवा सूचित करतात की जीपीटी -4.5 चे पॅरामीटर आकार आणखी मोठे असू शकते.

 

मॉडेल पॅरामीटरच्या आकारात वाढत असताना, प्रशिक्षण खर्च देखील गगनाला भिडत आहेत. ग्रोक 3 च्या उपस्थितीसह, जीपीटी -4.5 सारखे दावेदार आणि पॅरामीटर आकाराद्वारे चांगले मॉडेल कामगिरी साध्य करण्यासाठी “ज्वलनशील पैसे” सुरू ठेवण्याची इच्छा असलेल्या इतरांनी आता स्पष्टपणे दृष्टीक्षेपात असलेल्या कमाल मर्यादेचा विचार केला पाहिजे आणि त्यावर मात कशी करावी यावर विचार केला पाहिजे. या क्षणी, ओपनई येथील माजी मुख्य वैज्ञानिक इलिया सुत्स्कीव्हर यांनी यापूर्वी गेल्या डिसेंबरमध्ये म्हटले होते की, "ज्या प्री-ट्रेनिंगची आपण परिचित आहे ती संपुष्टात येईल", ज्याने चर्चेत पुन्हा उभे केले आहे आणि मोठ्या मॉडेल्सना प्रशिक्षण देण्यासाठी खरा मार्ग शोधण्याचा प्रयत्न केला.

640 (3)

इलियाच्या दृष्टिकोनातून उद्योगातील गजर वाजला आहे. प्रवेश करण्यायोग्य नवीन डेटाच्या निकटवर्ती थकव्याचा त्यांनी अचूक अंदाज लावला आहे, ज्यामुळे डेटा अधिग्रहणातून कामगिरी वाढविली जाऊ शकत नाही, जी जीवाश्म इंधनांच्या थकवाशी तुलना करते. त्यांनी असे सूचित केले की "तेलाप्रमाणेच इंटरनेटवर मानवी-व्युत्पन्न सामग्री मर्यादित स्त्रोत आहे." सुत्स्कीव्हरच्या भविष्यवाण्यांमध्ये, मॉडेलची पुढील पिढी, प्री-प्री-ट्रेनिंग, "खरी स्वायत्तता" आणि तर्कसंगत क्षमता "मानवी मेंदूत सारखीच" असेल.

 

आजच्या पूर्व-प्रशिक्षित मॉडेल्सच्या विपरीत जे प्रामुख्याने सामग्री जुळण्यावर अवलंबून असतात (पूर्वी शिकलेल्या मॉडेल सामग्रीवर आधारित), भविष्यातील एआय सिस्टम मानवी मेंदूच्या "विचारसरणीच्या" पद्धतीने समस्या सोडविण्यासाठी पद्धती शिकण्यास आणि स्थापित करण्यास सक्षम असतील. फक्त मूलभूत व्यावसायिक साहित्यासह एखाद्या विषयात एक मनुष्य मूलभूत प्रवीणता प्राप्त करू शकतो, तर एआय मोठ्या मॉडेलला फक्त सर्वात मूलभूत प्रवेश-स्तरीय कार्यक्षमता प्राप्त करण्यासाठी कोट्यावधी डेटा पॉईंट्सची आवश्यकता असते. जरी शब्द किंचित बदलले जातात, तरीही या मूलभूत प्रश्नांना योग्यरित्या समजू शकत नाही, हे स्पष्ट करते की मॉडेलने बुद्धिमत्तेत मनापासून सुधारित केले नाही: लेखाच्या सुरूवातीस नमूद केलेले मूलभूत परंतु नष्ट करणारे प्रश्न या घटनेचे स्पष्ट उदाहरण दर्शवितात.

_20240614024031.jpg1

निष्कर्ष

तथापि, क्रूर शक्तीच्या पलीकडे, जर ग्रोक 3 खरोखरच उद्योगास प्रकट करण्यात यशस्वी झाला की "पूर्व-प्रशिक्षित मॉडेल्स त्यांच्या समाप्तीकडे येत आहेत," या क्षेत्रासाठी महत्त्वपूर्ण परिणाम देतील.

कदाचित ग्रोक 3 च्या आसपासच्या उन्मादानंतर, आम्ही फी-फेई लीच्या "विशिष्ट डेटासेटवर उच्च-कार्यक्षमता मॉडेल ट्यूनिंग करणे" या उदाहरणासारख्या अधिक प्रकरणे पाहिल्या, शेवटी एजीआयचा खरा मार्ग शोधला.

ईएलव्ही केबल सोल्यूशन शोधा

केबल नियंत्रित करा

बीएमएस, बस, औद्योगिक, इन्स्ट्रुमेंटेशन केबलसाठी.

संरचित केबलिंग सिस्टम

नेटवर्क आणि डेटा, फायबर-ऑप्टिक केबल, पॅच कॉर्ड, मॉड्यूल, फेसप्लेट

2024 प्रदर्शन आणि कार्यक्रमांचे पुनरावलोकन

एप्रिल .१ th व्या -१th व्या, २०२24 दुबईमध्ये मध्य-पूर्व-उर्जा

एप्रिल .16 व्या -18, 2024 मॉस्कोमध्ये सिक्युरिका

मे .9 व्या, 2024 नवीन उत्पादने आणि तंत्रज्ञान शांघायमध्ये कार्यक्रम सुरू करा

ऑक्टोबर .२२२२२, २०२24 बीजिंगमधील सुरक्षा चीन

नोव्हेंबर .१ -20 -२०, २०२24 कनेक्ट वर्ल्ड केएसए


पोस्ट वेळ: फेब्रुवारी -19-2025