ऐसे मामले जहां हमें अभी भी GitHub सर्च बॉक्स की आवश्यकता है
jobs:
awesome-cv-copy:
runs-on: ubuntu-latest
steps:
# ...
- name: TeX Live 2023 इंस्टॉल करें
if: steps.cache-texlive.outputs.cache-hit != 'true'
run: |
# TeX Live इंस्टॉलर के लिए आवश्यक डिपेंडेंसी इंस्टॉल करें
sudo apt-get update
sudo apt-get install -y perl wget xz-utils
# TeX Live इंस्टॉलर डाउनलोड करें
wget http://mirror.ctan.org/systems/texlive/tlnet/install-tl-unx.tar.gz
tar -xzf install-tl-unx.tar.gz
cd install-tl-*/
# ...
- name: लापता LaTeX पैकेज इंस्टॉल करें
run: |
sudo /usr/local/texlive/2023/bin/x86_64-linux/tlmgr install etoolbox adjustbox
- name: पैकेज इंस्टॉलेशन की पुष्टि करें
run: |
kpsewhich etoolbox.sty
kpsewhich adjustbox.sty
- name: Run make awesome-cv-copy
run: make awesome-cv-copy
मैं ऊपर दिए गए GitHub Actions स्क्रिप्ट पर काम कर रहा हूँ।
मुझे GitHub पर etoolbox adjustbox language:YAML
के लिए सटीक कोड खोजने की आवश्यकता है।
मुझे निम्नलिखित त्रुटि का सामना करना पड़ा:
2025-01-07T22:34:58.6493408Z
2025-01-07T22:34:58.6493741Z ! LaTeX त्रुटि: फ़ाइल adjustbox.sty नहीं मिली।
2025-01-07T22:34:58.6494172Z
2025-01-07T22:34:58.6494593Z X टाइप करके बाहर निकलें या <RETURN> दबाकर आगे बढ़ें,
2025-01-07T22:34:58.6495322Z या नया नाम दर्ज करें। (डिफ़ॉल्ट एक्सटेंशन: sty)
मैं विशेष रूप से etoolbox adjustbox language:YAML
खोज रहा हूँ, और GitHub में परिणाम सीमित हैं, केवल 53 YAML फ़ाइलें हैं जिनमें etoolbox
और adjustbox
दोनों शामिल हैं। मुझे एक सटीक मिलान चाहिए।
हालांकि हम बड़े भाषा मॉडल्स के युग में हैं, फिर भी सटीक मिलान खोजने की आवश्यकता अभी भी महत्वपूर्ण है। यह विशेष रूप से तब सच होता है जब किसी चीज़ का सटीक अर्थ जांचना हो या सटीक कार्यशील कोड ढूंढना हो। इसी तरह, Google, Twitter, या अन्य प्लेटफॉर्म्स भी अर्थ के लिए सटीक खोज पर निर्भर करते हैं। हम AI-जनित परिणाम या छोटी-मोटी गलतियों वाले परिणाम नहीं चाहते हैं।
बड़े भाषा मॉडल को प्रशिक्षित करने के लिए, हम एक ऐसी प्रणाली विकसित कर सकते हैं जो सटीक मिलान ढूंढती है। शायद हम KMP (Knuth-Morris-Pratt) खोज एल्गोरिदम को ट्रांसफॉर्मर आर्किटेक्चर के साथ जोड़कर खोज क्षमताओं को बढ़ा सकते हैं। ट्रांसफॉर्मर के साथ KMP का उपयोग करने से विशिष्ट कोड खोजों के लिए अधिक सटीक परिणाम प्राप्त करने में मदद मिल सकती है।
वर्तमान में, बड़े भाषा मॉडल YAML या Python जैसी फ़ाइल भाषाओं के आधार पर फ़िल्टर नहीं कर सकते हैं। हालांकि, वास्तविक दुनिया में जानकारी का एक बड़ा हिस्सा इसी तरह से व्यवस्थित होता है। इसका मतलब है कि हम बड़े भाषा मॉडल को फ़ाइलों का उपयोग करके प्रशिक्षित कर सकते हैं। यदि हम सभी टेक्स्ट डेटा को फ़ाइल प्रकारों के आधार पर व्यवस्थित करते हैं, तो हम मॉडल को उन्हें बेहतर ढंग से समझने के लिए प्रशिक्षित कर सकते हैं। इसलिए, बड़े भाषा मॉडल के लिए, हमें शुरुआत में फ़ाइल भाषाओं को पूर्वनिर्धारित करने की आवश्यकता होगी। डिफ़ॉल्ट रूप से, यह “टेक्स्ट” हो सकता है, लेकिन हम अन्य भाषाओं को भी परिभाषित कर सकते हैं, जैसे कि GitHub Search करता है। परिणाम फ़ाइलों को लौटाएगा, जैसे कि GitHub खोज परिणाम करते हैं।
महत्वपूर्ण हिस्सा फ़ाइल फॉर्मेट या एक्सटेंशन है, न कि फ़ाइल का नाम। यहां कुछ उदाहरण दिए गए हैं:
पायथन, जावास्क्रिप्ट, जावा, रूबी, गो, सी++, सी, सी#, टाइपस्क्रिप्ट, एचटीएमएल, सीएसएस, पीएचपी, स्विफ्ट, कोटलिन, रस्ट, ऑब्जेक्टिव-सी, बैश, मार्कडाउन, आर, लुआ, हास्केल, MATLAB, पर्ल, एसक्यूएल, डॉकरफाइल, YAML, JSON, TOML, VHDL, TeX, LaTeX, असेंबली, GraphQL
.py, .js, .java, .rb, .go, .cpp, .cc, .cxx, .h, .c, .cs, .ts, .html, .htm, .css, .php, .swift, .kt, .kts, .rs, .m, .h, .sh, .md, .r, .lua, .hs, .m, .pl, .pm, .sql, Dockerfile, .yaml, .yml, .json, .toml, .vhdl, .vhd, .tex, .asm, .graphql, .gql
हालांकि, जब किसी उपयोगकर्ता का प्रॉम्प्ट सामान्य टेक्स्ट को फ़ाइल-जैसे एक्सप्रेशन और प्रतीकों के साथ मिलाता है, तो इस तरह की खोज करना मुश्किल हो जाता है। उदाहरण के लिए, Stack Overflow जैसे प्लेटफॉर्म पर, प्रश्न या उत्तरों में अक्सर टेक्स्ट कोड स्निपेट्स या फ़ाइल एक्सप्रेशन के साथ मिश्रित होता है।
लेकिन निश्चित रूप से, इस क्षेत्र में नए उत्पादों की कल्पना की जा सकती है जो प्राकृतिक भाषा खोज और फ़ाइल-आधारित खोज के बीच की खाई को पाट सकें।