ServBay Dahili SCWS Modülünün Nasıl Etkinleştirileceği
ServBay, güçlü bir entegre web geliştirme aracı olarak kendi SCWS modülüne sahiptir ve etkinleştirilmesi son derece kolaydır. SCWS (Simple Chinese Word Segmentation), hızlı ve doğru bir şekilde Çince metin ayrıştırma işlemi yapabilen verimli bir Çince kelime ayrıştırma motorudur. Arama motorları, metin analizi gibi uygulama senaryoları için çok uygundur.
SCWS Modülü Tanıtımı
SCWS, Çince metinleri işlemek için tasarlanmış açık kaynaklı bir Çince kelime ayrıştırma motorudur. Sözlük eşleştirme ve istatistiksel modelin birleşimi yoluyla, verimli ve doğru bir ayrıştırma sağlar. SCWS, yalnızca normal ayrıştırma işlevini değil, aynı zamanda anahtar kelime çıkarımı ve kelime türü etiketleme gibi ileri düzey işlevleri de destekler.
Ana Özellikler
- Verimli Ayrıştırma: SCWS, büyük ölçekli Çince metinleri hızlı bir şekilde işleyebilen verimli bir ayrıştırma algoritması kullanır.
- Yüksek Doğruluk: Sözlük eşleştirme ve istatistiksel modeli birleştirerek, SCWS, ayrıştırma doğruluğunda belirgin bir avantaja sahiptir.
- Çoklu İşlev Desteği: Temel ayrıştırma işlevinin yanı sıra, SCWS, anahtar kelime çıkarımı ve kelime türü etiketleme gibi ileri düzey işlevleri de destekler.
- Kolay Entegrasyon: SCWS, geliştiricilerin çeşitli uygulamalara kolayca entegre edebileceği zengin bir API sağlar.
- Açık Kaynak: SCWS, açık kaynaklı bir yazılımdır ve geliştiriciler ihtiyaçlarına göre uyarlayabilir ve genişletebilirler.
ServBay Dahili SCWS Modül Versiyonu
ServBay, birden çok PHP sürümünü destekler ve her sürüm için ilgili SCWS modülünü önceden yüklemiştir. Belirli sürümler şu şekildedir:
- PHP 5.6 - 8.4: SCWS 1.2.3
SCWS Modülünün Nasıl Etkinleştirileceği
Varsayılan olarak, SCWS modülü devre dışıdır. SCWS modülünü etkinleştirme adımları son derece basittir, sadece Dil
-PHP
sekmesine gidin, SCWS modülünü etkinleştirmek istediğiniz PHP sürümünü seçin, örneğin PHP 8.4
, sağdaki Uzantılar
butonuna tıklayın ve SCWS
modülünün sol tarafındaki anahtarı açarak kaydedin.
Kullanıcılar ayrıca modül yapılandırmasını manuel olarak açabilir veya değiştirebilir, işte ayrıntılı adımlar:
Adım 1: Yapılandırma Dosyasını Bulun
İlk olarak, ilgili PHP sürümünün conf.d
dizinine gidin. Örneğin, PHP 8.3 için SCWS modülünü etkinleştirmek istiyorsanız, aşağıdaki dosyayı düzenlemeniz gerekir:
/Applications/ServBay/etc/php/8.3/conf.d/scws.ini
Adım 2: Yapılandırma Dosyasını Düzenleyin
scws.ini
dosyasını açın ve aşağıdaki satırların yorumunu kaldırın:
[scws]
; Uncomment the following line to enable scws
extension = scws.so
scws.default.charset = gbk
scws.default.fpath = /Applications/ServBay/etc/scws
2
3
4
5
Adım 3: PHP Hizmetini Yeniden Başlatın
ServBay'in hizmet yönetim panelinde ilgili PHP hizmetini yeniden başlatın. Örneğin, PHP 8.3 hizmetini yeniden başlatın. Yeniden başlattıktan sonra, SCWS modülü başarıyla yüklenecektir.
SCWS Modülünün Başarıyla Yüklenip Yüklenmediğini Doğrulama
SCWS modülünün başarıyla yüklenip yüklenmediğini doğrulamak için basit bir PHP dosyası oluşturabilirsiniz. Web sunucusunun kök dizininde bir phpinfo.php
dosyası oluşturun, içeriği aşağıdaki gibi olsun:
<?php
phpinfo();
?>
2
3
https://servbay.host/phpinfo.php
adresine giderek SCWS modülünün ilgili bilgilerini PHP bilgi sayfasında arayın. SCWS'nin ilgili bilgilerini görüyorsanız, modülün başarıyla yüklendiği anlamına gelir.
SCWS Sözlüğü Oluşturma
SCWS kullanarak ayrıştırma yapmadan önce, sözlük dosyası oluşturulmalı ve yapılandırılmalıdır. SCWS'nin kullandığı sözlük dosyası, normal metin dosyası veya ikili formatta bir xdb dosyası olabilir. Sözlük oluşturma adımları şu şekildedir:
Adım 1: Sözlük Dosyası Hazırlayın
Gerekli kelimeleri ve kelime frekanslarını içeren normal bir metin dosyası oluşturun. Dosya formatı şu şekildedir:
kelime1 frekansı1
kelime2 frekansı2
2
Örneğin:
Çin 1000
Pekin 800
Şanghay 600
2
3
Bu dosyayı dict.txt
olarak kaydedin.
Adım 2: xdb Formatında Sözlük Dosyası Oluşturun
SCWS, xdb formatında sözlük dosyası oluşturmanızı sağlayan araçlar sunar. SCWS araçları ServBay ile beraber gelir ve aşağıdaki komut ile xdb dosyası oluşturabilirsiniz:
scws-gen-dict -i dict.txt -o dict.utf8.xdb
Bu komut, dict.txt
dosyasını dict.utf8.xdb
dosyasına dönüştürecektir.
Adım 3: SCWS'nin Sözlük Dosyasını Kullanacak Şekilde Yapılandırın
Oluşturulan dict.utf8.xdb
dosyasını /Applications/ServBay/etc/scws
dizinine yerleştirin ve scws.ini
dosyasında sözlük yolunu doğru yapılandırdığınızdan emin olun:
[scws]
; Uncomment the following line to enable scws
extension = scws.so
scws.default.charset = utf8
scws.default.fpath = /Applications/ServBay/etc/scws
2
3
4
5
Kullanım Örneği
SCWS modülünü etkinleştirdikten ve sözlüğü yapılandırdıktan sonra, PHP kodunda SCWS'yi kullanarak Çince kelime ayrıştırması yapabilirsiniz. Aşağıda basit bir örnek verilmiştir:
Örnek Kod
<?php
// SCWS'yi başlat
$scws = scws_new();
$scws->set_charset('utf8');
$scws->set_dict('/Applications/ServBay/etc/scws/dict.utf8.xdb');
$scws->set_rule('/Applications/ServBay/etc/scws/rules.utf8.ini');
// Ayrıştırılacak metin
$text = "我是中国人,我爱我的祖国。";
// Ayrıştırmayı gerçekleştir
$scws->send_text($text);
// Ayrıştırma sonuçlarını al
while ($result = $scws->get_result()) {
foreach ($result as $word) {
echo $word['word'] . "\n";
}
}
// SCWS kaynaklarını serbest bırak
$scws->close();
?>
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Yukarıdaki kodda öncelikle SCWS'yi başlattık ve karakter setini, sözlüğü ve kural dosyasını ayarladık. Daha sonra ayrıştırılacak metni SCWS'ye ilettik ve döngü aracılığıyla ayrıştırma sonuçlarını elde ettik. En sonunda SCWS kaynaklarını bıraktık.
Sonuç
ServBay, SCWS modülünü yönetmek ve etkinleştirmek için kullanışlı bir yol sunar. Basit yapılandırma ve yeniden başlatma işlemleriyle, geliştiriciler SCWS modülünü farklı PHP sürümlerinde hızlı bir şekilde etkinleştirebilir ve Çince metin işlemenin verimliliğini artırmak için verimli ve doğru ayrıştırma işlevlerinden tam olarak yararlanabilir. SCWS'nin verimli ayrıştırma, yüksek doğruluk ve zengin özellikleri, Çince metin analizi ve işlemenin bir numaralı tercihi haline getirir.