TF-IDF算法介绍

TF-IDF(Term Frequency–Inverse Document Frequency),一种词频计算算法,等于某词在文档中出现概率 x 该词在所有文档中出现的概率的对数,即TF x IDF。

其中:TF和IDF的具体计算公式如下

上式中n(ij)是该词在文件d(j)中出现的次数,而分母则是在文件d(j)中所有字词的出现次数之和。

[……]

继续阅读

Docker kubernetes基础教程

什么是kubernetes

Kubernetes 这个名字源自希腊语,意思是“舵手”,也是“管理者”,“治理者”和“cybernetic”的源头。k8s 是Kubernetes的简称(用数字『8』替代中间的8个字母『ubernete』)。

对于现代Web服务,用户希望应用程序7×24全天候可用,开发人员希望每天多次部署这些应用程序的更新版本。

[……]

继续阅读

守护进程原理及Python实现

守护进程,不依赖于终端,在后台运行的程序,通常称为daemon(ˈdiːmənˈdeɪmən)。

一些常见的Linux软件通常都是已守护进程的方式运行,比如:

nginx

redis

memcached

 

守护进程的原理:

通过fork() 复刻出子进程,并通过setsid()创建新会话,成为会话首领;同时结束原来的父进程,使得复刻出来[……]

继续阅读

什么是GatewayWorker

GatewayWorker基于Workerman开发的一个项目框架,用于快速开发TCP长连接应用,例如app推送服务端、即时IM服务端、游戏服务端、物联网、智能家居等等

GatewayWorker使用经典的Gateway和Worker进程模型。
Gateway进程负责维持客户端连接,并转发客户端的数据给BusinessWorker进程处理
Busine[……]

继续阅读

Zephir是高性能PHP框架Phalcon厂商开发的开源高级/特定领域语言,它在降低PHP扩展开发、维护的复杂性的同时,也致力于保证类型和内存安全。Zephir是Zend Engine/PHP/Intermediate缩写,读作“zaefire”。

Zephir的主要特点:

Type system dynamic/static
Memory safety pointers or d[……]

继续阅读