اختر اللغة

الحوسبة العصبية الشكلية لاسترجاع الصور القائم على المحتوى

بحث حول تطبيق شريحة لوهي العصبية الشكلية من إنتل لاسترجاع الصور الموفّر للطاقة باستخدام الشبكات العصبية النبضية، محققاً كفاءة طاقية أفضل بـ2.5-12.5 مرة من المعالجات التقليدية.
hashpowertoken.org | PDF Size: 0.5 MB
التقييم: 4.5/5
تقييمك
لقد قيمت هذا المستند مسبقاً
غلاف مستند PDF - الحوسبة العصبية الشكلية لاسترجاع الصور القائم على المحتوى

جدول المحتويات

2.5x

أكثر كفاءة من معالج ARM

12.5x

أكثر كفاءة من معالج NVIDIA T4

نفس الدقة

الحفاظ على الأداء المطابق

1. المقدمة

تمثل الحوسبة العصبية الشكلية نقلة نوعية عن بنى فون نيومان التقليدية من خلال محاكاة النشاط العصبي للدماغ باستخدام الشبكات العصبية النبضية. يستكشف هذا البحث تطبيق شريحة لوهي العصبية الشكلية من إنتل لاسترجاع الصور القائم على المحتوى، مُظهراً تحسناً كبيراً في كفاءة الطاقة مع الحفاظ على دقة تنافسية مقارنة بالمعالجات التقليدية.

2. الطرق

2.1 تحويل الشبكات العصبية الاصطناعية إلى شبكات عصبية نبضية

تشمل المنهجية تحويل الشبكات العصبية الاصطناعية المدربة إلى شبكات عصبية نبضية باستخدام الترميز القائم على المعدل. يحافظ عملية التحويل على القدرات الوظيفية للشبكة مع التكيف مع الطبيعة القائمة على الأحداث للأجهزة العصبية الشكلية.

2.2 نشر شريحة لوهي

تُنفذ شريحة لوهي من إنتل الشبكة العصبية النبضية بأجهزة متخصصة للحسابات العصبية النبضية. تتضمن عملية النشر تعيين الشبكة العصبية النبضية المحولة إلى النوى العصبية في لوهي وتهيئة بروتوكولات اتصال النبضات.

3. التنفيذ التقني

3.1 الإطار الرياضي

يتبع نموذج الخلية العصبية النبضية ديناميكيات التكامل والتسرب والإطلاق:

$\\tau_m \\frac{dV}{dt} = -[V(t) - V_{rest}] + R_m I(t)$

حيث $\\tau_m$ هو ثابت زمن الغشاء، $V(t)$ هو جهد الغشاء، $V_{rest}$ هو جهد الراحة، $R_m$ هو مقاومة الغشاء، و $I(t)$ هو التيار المدخل.

3.2 بنية الشبكة

تتكون بنية الشبكة العصبية النبضية المُنفذة من طبقات تلافيفية تليها طبقات متصلة بالكامل. تم تدريب الشبكة على مجموعة بيانات Fashion-MNIST وتكييفها لاستخراج الميزات في خط أنابيب استرجاع الصور.

4. النتائج التجريبية

4.1 مقاييس الأداء

حقق النظام دقة استرجاع مماثلة للأساليب التقليدية القائمة على الشبكات التلافيفية مع تقليل استهلاك الطاقة بشكل كبير. أثبتت التضمينات المُنتجة من أنماط النبضات الزمنية فعاليتها للبحث عن أقرب جوار في فضاء الميزات البصرية.

4.2 تحليل كفاءة الطاقة

أظهر التحليل المقارن أن الحل العصبي الشكلي كان أكثر كفاءة في استهلاك الطاقة بـ 2.5 مرة من معالج ARM Cortex-A72 وأكثر كفاءة بـ 12.5 مرة من معالج NVIDIA T4 لمهام الاستدلال بدون تجميع.

5. تنفيذ الكود

فيما يلي كود زائف مبسط لخط أنابيب استرجاع الصور القائم على الشبكات العصبية النبضية:

# خط أنابيب استرجاع الصور بالشبكات العصبية النبضية
class SNNImageRetrieval:
    def __init__(self):
        self.snn_model = load_snn_model()
        self.embedding_db = None
    
    def generate_embeddings(self, images):
        """توليد التضمينات من أنماط النبضات"""
        embeddings = []
        for img in images:
            spikes = self.snn_model.forward(img)
            embedding = self.extract_spike_features(spikes)
            embeddings.append(embedding)
        return embeddings
    
    def query_image(self, query_img, k=5):
        """إيجاد أقرب k جوار للصورة الاستعلام"""
        query_embedding = self.generate_embeddings([query_img])[0]
        distances = cosine_distance(query_embedding, self.embedding_db)
        nearest_indices = np.argsort(distances)[:k]
        return nearest_indices

6. التطبيقات المستقبلية

تُظهر الحوسبة العصبية الشكلية promise لتطبيقات الذكاء الاصطناعي على الحافة، وتحليل الفيديو في الوقت الفعلي، والأنظمة المضمنة منخفضة الطاقة. تشمل اتجاهات البحث المستقبلية:

  • التكامل مع بنى المحولات للاسترجاع متعدد الوسائط
  • تطوير قدرات التعلم عبر الإنترنت لمجموعات البيانات الديناميكية
  • التطبيق في الأنظمة المستقلة التي تتطلب معالجة بصرية في الوقت الفعلي
  • الجمع مع الخوارزميات المستوحاة من الكم لتعزيز الأداء

7. التحليل الأصلي

يمثل هذا البحث معلماً مهماً في تطبيقات الحوسبة العصبية الشكلية لمهام رؤية الحاسوب. إن تحسن كفاءة الطاقة الذي تم إظهاره بمقدار 2.5-12.5 مرة مقارنة بالمعالجات التقليدية يتماشى مع الاتجاه الأوسع في تخصص أجهزة الذكاء الاصطناعي، على غرار التطور الذي شوهد في وحدات معالجة TensorFlow من جوجل ووحدات معالجة الذكاء من Graphcore. يشير نجاح لوهي في مهام استرجاع الصور إلى أن البنى العصبية الشكلية يمكن أن تصبح مكملة لأنظمة فون نيومان الحالية، خاصة لتطبيقات الحوسبة على الحافة حيث تكون قيود الطاقة حرجة.

يتبع نهج تحويل الشبكات العصبية الاصطناعية المدربة مسبقاً إلى شبكات عصبية نبضية، كما تم توضيحه في هذا العمل، المنهجيات المعتمدة في المجال. ومع ذلك، يكمن الابتكار في تطبيق هذه التقنية تحديداً على استرجاع الصور القائم على المحتوى، وهي مهمة تتطلب عادة موارد حاسوبية كبيرة. إن مستويات الدقة المحفوظة مع تحقيق تخفيضات كبيرة في الطاقة تُثبت الجدوى العملية للحلول العصبية الشكلية للتطبيقات الواقعية.

مقارنة بparadigms الحوسبة الناشئة الأخرى مثل تعلم الآلة الكمي أو الحوسبة الضوئية، تقدم الحوسبة العصبية الشكلية ميزة التوافق الأقرب مع أطر الشبكات العصبية الحالية. كما لوحظ في IEEE Transactions on Pattern Analysis and Machine Intelligence، فإن كفاءة الطاقة لأنظمة الحوسبة العصبية الشكلية تجعلها مناسبة بشكل خاص لتطبيقات الذكاء الاصطناعي دائمة التشغيل وأجهزة إنترنت الأشياء. يفتح تكامل الديناميكيات الزمنية في الشبكات العصبية النبضية أيضاً إمكانيات لمعالجة الفيديو وتحليل البيانات المتسلسلة التي تتجاوز استرجاع الصور الثابتة.

يمكن أن تستكشف التطورات المستقبلية البنى الهجينة التي تجمع بين نقاط قوة التعلم العميق التقليدي مع كفاءة الحوسبة العصبية الشكلية، على غرار النهج التي تمت مناقشتها في Nature Machine Intelligence. يبقى قابلية توسع هذه الأنظمة لمجموعات البيانات الأكبر ومهام الاسترجاع الأكثر تعقيداً اتجاه بحثي مهم، وكذلك تطوير خوارزميات تدريب متخصصة تُحسن مباشرة للأجهزة العصبية الشكلية بدلاً من الاعتماد على تحويل الشبكات العصبية الاصطناعية إلى شبكات عصبية نبضية.

8. المراجع

  1. Liu, T.-Y., et al. "Neuromorphic Computing for Content-based Image Retrieval." arXiv:2008.01380 (2021)
  2. Davies, M., et al. "Loihi: A Neuromorphic Manycore Processor with On-Chip Learning." IEEE Micro (2018)
  3. Maass, W. "Networks of spiking neurons: The third generation of neural network models." Neural Networks (1997)
  4. Roy, K., et al. "Towards Spike-based Machine Intelligence with Neuromorphic Computing." Nature (2019)
  5. Xiao, H., et al. "Fashion-MNIST: A Novel Image Dataset for Benchmarking Machine Learning Algorithms." arXiv:1708.07747 (2017)
  6. Merolla, P. A., et al. "A million spiking-neuron integrated circuit with a scalable communication network and interface." Science (2014)