كيفية تفعيل وحدة SCWS المدمجة في ServBay
باعتبارها أداة تطوير ويب متكاملة قوية، فإن ServBay تأتي مزودة بوحدة SCWS، وعملية تفعيلها بسيطة جدًا. SCWS (تقسيم الكلمات الصينية البسيط) هو محرك تقسيم الكلمات الصينية فعال، يمكنه معالجة النصوص الصينية بسرعة ودقة، مما يجعله مناسبًا جدًا لمحركات البحث وتحليل النصوص وغيرها من السيناريوهات.
مقدمة عن وحدة SCWS
SCWS هو محرك تقسيم الكلمات الصينية مفتوح المصدر، تم تصميمه خصيصًا لمعالجة النصوص الصينية. من خلال الجمع بين مطابقة القاموس ونماذج الإحصاء، فإنه يوفر وظائف تقسيم الكلمات بكفاءة ودقة عالية. SCWS لا يدعم فقط وظائف تقسيم الكلمات الأساسية، بل يدعم أيضًا استخراج الكلمات المفتاحية ووضع علامات على أجزاء الكلام.
الميزات الرئيسية
- تقسيم سريع: تعتمد SCWS خوارزمية تقسيم فعالة، يمكنها معالجة النصوص الصينية الكبيرة بسرعة.
- دقة عالية: من خلال الجمع بين مطابقة القاموس ونماذج الإحصاء، تتمتع SCWS بمزايا واضحة في دقة التقسيم.
- دعم متعدد الوظائف: بالإضافة إلى وظائف تقسيم الكلمات الأساسية، تدعم SCWS أيضًا استخراج الكلمات المفتاحية ووضع علامات على أجزاء الكلام.
- سهولة التكامل: توفر SCWS API غنيًا، مما يتيح للمطورين دمجها بسهولة في تطبيقات مختلفة.
- مفتوحة المصدر: SCWS هو برنامج مفتوح المصدر، يمكن للمطورين تخصيصه وتوسيعه حسب الحاجة.
نسخة وحدة SCWS المدمجة في ServBay
يدعم ServBay عدة إصدارات من PHP، ولكل إصدار تثبيت مسبق لوحدة SCWS المناسبة. النسخ المحددة هي:
- PHP 5.6 - 8.4: SCWS 1.2.3
كيفية تفعيل وحدة SCWS
بشكل افتراضي، تكون وحدة SCWS معطلة. خطوات تفعيل وحدة SCWS بسيطة جدًا، فقط تحتاج إلى تعديل ملف التكوين للإصدار المقابل لـ PHP. الخطوات التفصيلية كما يلي:
الخطوة الأولى: العثور على ملف التكوين
أولًا، حدد موقع دليل conf.d
الخاص بالإصدار المقابل من PHP. على سبيل المثال، إذا كنت ترغب في تفعيل وحدة SCWS لـ PHP 8.3، تحتاج إلى تحرير الملف التالي:
/Applications/ServBay/etc/php/8.3/conf.d/scws.ini
الخطوة الثانية: تحرير ملف التكوين
افتح ملف scws.ini
، وألغِ التعليق على المحتوى التالي:
[scws]
; Uncomment the following line to enable scws
extension = scws.so
scws.default.charset = gbk
scws.default.fpath = /Applications/ServBay/etc/scws
2
3
4
5
الخطوة الثالثة: إعادة تشغيل خدمة PHP
في لوحة إدارة خدمات ServBay، قم بإعادة تشغيل خدمة PHP المناسبة. على سبيل المثال، أعد تشغيل خدمة PHP 8.3. بعد الانتهاء من إعادة التشغيل، سيتم تحميل وحدة SCWS بنجاح.
تحقق من أن وحدة SCWS تم تحميلها بنجاح
يمكنك التحقق من تحميل وحدة SCWS بنجاح عن طريق إنشاء ملف PHP بسيط. أنشئ ملف phpinfo.php
في الدليل الجذري لخادم الويب، بمحتوى كالتالي:
<?php
phpinfo();
?>
2
3
قم بزيارة https://servbay.host/phpinfo.php
، وابحث عن معلومات وحدة SCWS في صفحة معلومات PHP الناتجة. إذا رأيت معلومات SCWS، فهذا يعني أن الوحدة تم تحميلها بنجاح.
إنشاء قاموس SCWS
قبل استخدام SCWS لتقسيم الكلمات، تحتاج إلى إنشاء وتكوين ملف القاموس. يمكن أن يكون ملف القاموس الذي يستخدمه SCWS ملف نصي عادي أو ملف ثنائي بتنسيق xdb. الخطوات لخلق القاموس كما يلي:
الخطوة الأولى: تحضير ملف القاموس
أنشئ ملف نصي عادي يحتوي على الكلمات والترددات المطلوبة. صيغة الملف كالتالي:
كلمة1 تردد1
كلمة2 تردد2
2
على سبيل المثال:
中国 1000
北京 800
上海 600
2
3
احفظ الملف باسم dict.txt
.
الخطوة الثانية: توليد ملف القاموس بتنسيق xdb
يوفر SCWS أداة لتوليد ملف القاموس بتنسيق xdb. تأتي أدوات SCWS مدمجة مع ServBay، يمكنك استخدام الأمر التالي لتوليد ملف xdb:
scws-gen-dict -i dict.txt -o dict.utf8.xdb
سيقوم هذا الأمر بتحويل dict.txt
إلى ملف dict.utf8.xdb
.
الخطوة الثالثة: تكوين SCWS لاستخدام ملف القاموس
ضع ملف dict.utf8.xdb
المتولد في دليل /Applications/ServBay/etc/scws
، وتأكد من تكوين مسار القاموس بشكل صحيح في ملف scws.ini
:
[scws]
; Uncomment the following line to enable scws
extension = scws.so
scws.default.charset = utf8
scws.default.fpath = /Applications/ServBay/etc/scws
2
3
4
5
نموذج الاستخدام
بعد تفعيل وحدة SCWS وتكوين القاموس، يمكنك استخدام SCWS لتقسيم الكلمات الصينية في شفرة PHP. التالي هو مثال بسيط:
شفرة المثال
<?php
// Initialize SCWS
$scws = scws_new();
$scws->set_charset('utf8');
$scws->set_dict('/Applications/ServBay/etc/scws/dict.utf8.xdb');
$scws->set_rule('/Applications/ServBay/etc/scws/rules.utf8.ini');
// النص المطلوب تقسيمه
$text = "我是中国人,我爱我的祖国。";
// البدء في التقسيم
$scws->send_text($text);
// الحصول على نتائج التقسيم
while ($result = $scws->get_result()) {
foreach ($result as $word) {
echo $word['word'] . "\n";
}
}
// تحرير موارد SCWS
$scws->close();
?>
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
في الشفرة أعلاه، قمنا أولاً بتهيئة SCWS وضبطنا مجموعة الأحرف، القاموس، وملف القواعد. ثم قمنا بإرسال النص المطلوب تقسيمه إلى SCWS وحصلنا على نتائج التقسيم في حلقة. أخيرًا، حررنا موارد SCWS.
الخلاصة
يوفر ServBay طريقة مريحة لإدارة وتفعيل وحدة SCWS. من خلال إعدادات بسيطة وإعادة التشغيل، يمكن للمطورين تفعيل وحدة SCWS بسرعة في إصدارات PHP المختلفة، مما يسمح لهم بالاستفادة الكاملة من ميزات تقسيم الكلمات الفعالة والدقيقة لتحسين كفاءة معالجة النصوص الصينية. تجعل كفاءة SCWS العالية، ودقتها، ووظائفها المتنوعة خيارًا لا غنى عنه لتحليل النصوص الصينية ومعالجتها.