45 lines
1009 B
Python
45 lines
1009 B
Python
import jieba
|
||
|
||
'''
|
||
项目配置
|
||
'''
|
||
# 每次从数据库获取的案子数量
|
||
PHHD_BATCH_SIZE = 10
|
||
# 没有查询到案子的等待时间(分钟)
|
||
SLEEP_MINUTES = 5
|
||
# 是否发送报错邮件
|
||
SEND_ERROR_EMAIL = True
|
||
|
||
'''
|
||
别名配置
|
||
'''
|
||
# 使用别名中的value替换key。考虑到效率问题,只会替换第一个匹配到的key。
|
||
HOSPITAL_ALIAS = {
|
||
'沐阳': ['沭阳'],
|
||
'连水': ['涟水'],
|
||
'唯宁': ['睢宁'], # 雕宁
|
||
'九〇四': ['904'],
|
||
'漂水': ['溧水'],
|
||
}
|
||
DEPARTMENT_ALIAS = {
|
||
'耳鼻喉': ['耳鼻咽喉'],
|
||
'急症': ['急诊'],
|
||
}
|
||
|
||
'''
|
||
搜索过滤配置
|
||
'''
|
||
# 默认会过滤单字
|
||
HOSPITAL_FILTER = ['医院', '人民', '第一', '第二', '第三', '大学', '附属']
|
||
|
||
DEPARTMENT_FILTER = ['医', '伤', '西', '新']
|
||
|
||
'''
|
||
分词配置
|
||
'''
|
||
jieba.suggest_freq(('肿瘤', '医院'), True)
|
||
jieba.suggest_freq(('骨', '伤'), True)
|
||
jieba.suggest_freq(('感染', '性'), True)
|
||
jieba.suggest_freq(('胆', '道'), True)
|
||
jieba.suggest_freq(('脾', '胃'), True)
|