कोसाइन समानता एक आंतरिक उत्पाद स्थान के दो गैर-शून्य वैक्टरों के बीच समानता का एक माप है जो उनके बीच के कोण के कोसाइन को मापता है। दो दस्तावेजों के बीच समानता की डिग्री की पहचान करने के लिए इसका उपयोग अक्सर सूचना पुनर्प्राप्ति और टेक्स्ट माइनिंग में किया जाता है। इसका उपयोग चेहरे की पहचान, वस्तु पहचान और अन्य कार्यों के लिए मशीन लर्निंग एल्गोरिदम में भी किया जाता है।
कोसाइन समानता दो गैर-शून्य वैक्टर, ए और बी के बीच कोसाइन कोण पर आधारित है। दो वैक्टरों के बीच कोसाइन समानता उनकी समानता का एक संख्यात्मक प्रतिनिधित्व है; यह -1 से लेकर है जो पूरी तरह से अलग है, से लेकर 1 तक है जो बिल्कुल मेल खाता है।
कोसाइन समानता की गणना इस प्रकार है:
cos(θ) = a · b / |a| · |बी|
कहाँ |ए| और |बी| ए और बी के परिमाण हैं, और ए · बी ए और बी का डॉट उत्पाद है।
कोसाइन समानता का उपयोग शब्द एम्बेडिंग की तुलना करने, संबंधित शब्दों की पहचान करने और दस्तावेजों के बीच समानता की डिग्री की पहचान करने के लिए किया जा सकता है। इसका उपयोग टेक्स्ट के पुन: उपयोग को खोजने के लिए दो टेक्स्ट दस्तावेज़ों की तुलना करने के लिए भी किया जाता है। उदाहरण के लिए, कोसाइन समानता का उपयोग दस्तावेजों में साहित्यिक चोरी की पहचान करने के लिए किया जा सकता है।
मशीन लर्निंग में, कोसाइन समानता का उपयोग वस्तु पहचान, चेहरे की पहचान और अन्य कार्यों में किया जाता है। यह दो छवियों के बीच समानता को मापने के लिए एक लोकप्रिय तरीका है, जो चेहरे की बायोमेट्रिक्स में उपयोग किए जाने वाले चेहरे की पहचान अनुप्रयोगों के साथ-साथ वस्तु पहचान अनुप्रयोगों को भी सक्षम बनाता है। कोसाइन समानता का उपयोग पाठ के संग्रह में समान दस्तावेज़ों की पहचान करने के लिए भी किया जा सकता है।
कुल मिलाकर, कोसाइन समानता एक आंतरिक उत्पाद स्थान के दो गैर-शून्य वैक्टरों के बीच समानता का एक लोकप्रिय उपाय है। इसका उपयोग सूचना पुनर्प्राप्ति, टेक्स्ट माइनिंग, मशीन लर्निंग और अन्य क्षेत्रों में कई अलग-अलग अनुप्रयोगों में किया जा सकता है।