كيفية تفعيل وحدة SCWS المدمجة في ServBay
بصفته أداة قوية لتطوير الويب المتكاملة، يأتي ServBay مع وحدة SCWS المدمجة، وتفعيلها أمر بسيط للغاية. SCWS (التجزئة البسيطة للكلمات الصينية) هو محرك فعال لتجزئة الكلمات الصينية، يمكنه التعامل بسرعة ودقة مع النصوص الصينية، وهو مناسب جدًا لمحركات البحث وتحليل النصوص وغيرها من التطبيقات.
مقدمة إلى وحدة SCWS
SCWS هو محرك تجزئة كلمات صيني مفتوح المصدر، مصمم خصيصًا لمعالجة النصوص الصينية. ويوفر أداءً فعالاً ودقيقًا بفضل الجمع بين مطابقة القاموس والنماذج الإحصائية. ولا يدعم SCWS فقط وظائف التجزئة العادية، بل يدعم أيضًا استخراج الكلمات الرئيسية ووضع علامات على أنواع الكلمات وغيرها من الوظائف المتقدمة.
المميزات الرئيسية
- التجزئة الفعالة: تعتمد SCWS على خوارزمية تجزئة فعالة، يمكنها معالجة النصوص الصينية الكبيرة بسرعة.
- دقة عالية: عن طريق الجمع بين مطابقة القاموس والنماذج الإحصائية، يقدم SCWS ميزة واضحة في دقة التجزئة.
- يدعم وظائف متعددة: بالإضافة إلى وظائف التجزئة الأساسية، يدعم SCWS استخراج الكلمات الرئيسية ووضع علامات على أنواع الكلمات وغيرها من الوظائف المتقدمة.
- سهل التكامل: توفر SCWS واجهات برمجة تطبيقات غنية، مما يسمح للمطورين بتكاملها بسهولة في مختلف التطبيقات.
- مفتوح المصدر: SCWS هو برنامج مفتوح المصدر، يمكن للمطورين تخصيصه وتوسيعه حسب الحاجة.
إصدار وحدة SCWS في ServBay
يدعم ServBay نسخ متعددة من PHP، وكل نسخة تأتي مع إعداد SCWS خاص. التفصيل كما يلي:
- PHP 5.6 - 8.4: SCWS 1.2.3
كيفية تفعيل وحدة SCWS
افتراضيًا، وحدة SCWS معطلة. خطوات تفعيل وحدة SCWS بسيطة جدًا: قم بالتنقل إلى اللغة
-PHP
، اختر نسخة PHP المراد تفعيل الوحدة عليها، مثل PHP 8.4
، ثم انقر على الامتدادات
في الجانب الأيمن وفعّل المفتاح بجانب وحدة SCWS
، ثم احفظ التغييرات.
يمكن للمستخدم أيضًا تفعيلها أو تعديل الإعدادات يدويًا. الخطوات المفصلة كالتالي:
الخطوة الأولى: العثور على ملف الإعدادات
أولاً، حدد موقع مجلد conf.d
لنسخة PHP المطلوبة. على سبيل المثال، لتفعيل وحدة SCWS لـPHP 8.3، نحتاج إلى تعديل الملف التالي:
/Applications/ServBay/etc/php/8.3/conf.d/scws.ini
الخطوة الثانية: تعديل ملف الإعدادات
افتح ملف scws.ini
وأزل التعليقات عن الأسطر التالية:
[scws]
; Uncomment the following line to enable scws
extension = scws.so
scws.default.charset = gbk
scws.default.fpath = /Applications/ServBay/etc/scws
2
3
4
5
الخطوة الثالثة: إعادة تشغيل خدمة PHP
في لوحة إدارة خدمات ServBay، قم بإعادة تشغيل الخدمة لـPHP المناسبة. مثلاً، إعادة تشغيل خدمة PHP 8.3. بعد الانتهاء من إعادة التشغيل، سيُحمّل وحدة SCWS بنجاح.
التحقق من تحميل وحدة SCWS
يمكنك إنشاء ملف PHP بسيط للتحقق مما إذا كانت وحدة SCWS قد حُمّلت بنجاح أم لا. في الدليل الجذري لخادم الويب، أنشئ ملف phpinfo.php
بالمحتوى التالي:
<?php
phpinfo();
?>
2
3
قم بزيارة https://servbay.host/phpinfo.php
، وابحث عن معلومات وحدة SCWS في صفحة معلومات PHP الناتجة. إذا وجدت معلومات عن SCWS، فهذا يعني أن الوحدة قد حُمّلت بنجاح.
إنشاء قاموس SCWS
قبل استخدام SCWS لتجزئة الكلمات، تحتاج إلى إنشاء وتكوين ملف قاموس. يمكن أن يكون ملف القاموس المستخدم في SCWS إما ملف نصي عادي أو ملف ثنائي بتنسيق xdb. الخطوات لإنشاء القاموس هي كالتالي:
الخطوة الأولى: إعداد ملف القاموس
أنشئ ملف نصي عادي يحتوي على الكلمات والترددات المطلوبة. صيغة الملف كالتالي:
كلمة1 تردد1
كلمة2 تردد2
2
على سبيل المثال:
الصين 1000
بكين 800
شنغهاي 600
2
3
احفظ الملف باسم dict.txt
.
الخطوة الثانية: إنشاء ملف قاموس بتنسيق xdb
توفر SCWS أدوات لإنشاء ملف قاموس بتنسيق xdb. الأدوات متوفرة مع ServBay، ويمكن استخدام الأمر التالي لإنشاء ملف xdb:
scws-gen-dict -i dict.txt -o dict.utf8.xdb
هذا الأمر سيقوم بتحويل dict.txt
إلى dict.utf8.xdb
.
الخطوة الثالثة: تكوين SCWS لاستخدام ملف القاموس
ضع الملف المولد dict.utf8.xdb
في مجلد /Applications/ServBay/etc/scws
وتأكد من تكوين مسار القاموس بشكل صحيح في ملف scws.ini
:
[scws]
; Uncomment the following line to enable scws
extension = scws.so
scws.default.charset = utf8
scws.default.fpath = /Applications/ServBay/etc/scws
2
3
4
5
مثال على الاستخدام
بعد تفعيل وحدة SCWS وتكوين القاموس، يمكنك استخدام SCWS لتجزئة الكلمات الصينية في كود PHP. المثال البسيط التالي يوضح ذلك:
كود المثال
<?php
// تهيئة SCWS
$scws = scws_new();
$scws->set_charset('utf8');
$scws->set_dict('/Applications/ServBay/etc/scws/dict.utf8.xdb');
$scws->set_rule('/Applications/ServBay/etc/scws/rules.utf8.ini');
// النص للتجزئة
$text = "我是中国人,我爱我的祖国。";
// تنفيذ التجزئة
$scws->send_text($text);
// الحصول على نتائج التجزئة
while ($result = $scws->get_result()) {
foreach ($result as $word) {
echo $word['word'] . "\n";
}
}
// تحرير موارد SCWS
$scws->close();
?>
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
في الكود أعلاه، قمنا بتهيئة SCWS أولاً، وضبطنا مجموعة الأحرف، والقاموس، وملف القواعد. ثم مررنا النص المراد تجزئته إلى SCWS وحصلنا على نتائج التجزئة من خلال حلقة. وأخيرًا، تم تحرير موارد SCWS.
الخلاصة
يقدم ServBay طريقة مريحة لإدارة وتفعيل وحدة SCWS. من خلال تكوين بسيط وإعادة تشغيل، يمكن للمطورين تفعيل وحدة SCWS بسرعة في نسخ PHP المختلفة، مما يتيح لهم الاستفادة من وظائف التجزئة الفعالة والدقيقة لتحسين معالجة النصوص الصينية. إن كفاءة SCWS العالية ودقتها ووظائفها الغنية تجعلها الخيار الأمثل لتحليل ومعالجة النصوص الصينية.