कुछ भी हिस्सा, हाल ही में फेसबुक रिसर्च द्वारा जारी किया गया है, जो कंप्यूटर विजन में डूबे हुए अधिकांश लोगों को चुनौतीपूर्ण लगता है: विश्वसनीय रूप से यह जानना कि छवि में कौन से पिक्सेल किसी वस्तु से संबंधित हैं। इसे आसान बनाना सेगमेंट एनीथिंग मॉडल (एसएएम) का लक्ष्य है, जिसे हाल ही में अपाचे 2.0 लाइसेंस के तहत जारी किया गया था।
परिणाम बहुत अच्छे दिखते हैं, और हैं इंटरएक्टिव प्रस्तुति उपलब्ध है SAM के काम करने के विभिन्न तरीकों से आप खेल सकते हैं। किसी छवि को इंगित करके और उस पर क्लिक करके कोई भी चीज़ उठा सकता है, या छवियों को स्वचालित रूप से विभाजित किया जा सकता है। ईमानदारी से, एसएएम को एक छवि में विभिन्न वस्तुओं को मास्किंग करते हुए देखना प्रभावशाली है जो इतना आसान लगता है। यह क्या संभव बनाता है मशीन लर्निंग है, और इसका एक हिस्सा यह तथ्य है कि सिस्टम के पीछे के मॉडल को उच्च-गुणवत्ता वाली छवियों और मास्क के विशाल डेटा सेट पर प्रशिक्षित किया गया है, जो इसे करने में बेहद कुशल बनाता है।
एक बार जब छवि खंडित हो जाती है, तो इन मास्क का उपयोग अन्य प्रणालियों जैसे ऑब्जेक्ट डिटेक्शन (जो पहचानता है और लेबल करता है कि ऑब्जेक्ट क्या है) और अन्य कंप्यूटर दृष्टि अनुप्रयोगों के साथ बातचीत करने के लिए किया जा सकता है। यह प्रणाली अधिक शक्तिशाली रूप से काम करती है यदि वे वास्तव में जानते हैं कि आखिर कहां देखना है। यह मेटा एआई से ब्लॉग पोस्ट वह एसएएम के साथ क्या संभव है, इसके बारे में कुछ अतिरिक्त विवरण में जाता है, इसमें पूर्ण विवरण शोध पत्र.
ऐसी प्रणालियाँ उच्च गुणवत्ता वाले डेटासेट पर निर्भर करती हैं। बेशक, वास्तविक दुनिया के डेटा की तुलना में कुछ भी नहीं है, लेकिन हमने यह भी देखा है कि स्वचालित डेटा उत्पन्न करना संभव है जो वास्तव में मौजूद नहीं था, और उपयोगी परिणाम प्राप्त करता है।