华为OD机试真题-中文分词模拟器-2023年OD统一考试(C卷)

news/2024/7/20 17:15:32 标签: 华为od, 中文分词, c语言, java

题目描述:

给定一个连续不包含空格字符串,该字符串仅包含英文小写字母及英文文标点符号(逗号、分号、句号),同时给定词库,对该字符串进行精确分词。
说明:
1.精确分词: 字符串分词后,不会出现重叠。即“ilovechina” ,不同词库可分割为 “i,love,china” “ilove,china”,不能分割出现重叠的"i,ilove,china",i重叠出现
2.标点符号不成词,仅用于断句
3.词库:根据外部知识库统计出来的常用词汇例:dictionary=["i","love","china","lovechina","ilove"], 
4.分词原则:采用分词顺序优先且最长匹配原则
“ilovechina”,假设分词结果  [ i,ilove,lo,love,ch,china,lovechina ] 则输出 [ilove,china] 
 错误输出:[i,lovechina],            原因:"ilove ">优先于 "lovechina"成词
 错误输出:[i,love,china]            原因:"ilove" >"i"  遵循最长匹配原则

输入描述:

字符串长度限制:0<length<256
词库长度限制:  1<length<100000
第一行输入待分词语句 "ilovechina"
第二行输入中文词库   "


http://www.niftyadmin.cn/n/5296683.html

相关文章

7天玩转 Golang 标准库之 sort

数据排序 是编程任务的一个常见部分&#xff0c;而Go标准库的sort包提供了对切片和用户定义集合的排序操作。 1.基础排序&#xff1a;整数、浮点数和字符串 Golang自带了对于整数切片[]int&#xff0c;浮点数切片[]float64以及字符切片[]string的排序&#xff1a; package m…

实验3 vTPM相关

一、实验目的 1.了解vTPM原理和相关知识&#xff1b;2.创建具备vTPM的虚拟机&#xff1b;3.加深对可信计算技术的理解。 二、实验内容 安装seabios&#xff0c;libtpms&#xff0c;swtpm&#xff0c;qemu‐tpm&#xff1b;启动vTPM&#xff1b;安装虚拟机。 三、实验环境 …

【liunx系统篇】开发中最常用的命令

ls 命令 ls -a 列出目录所有文件&#xff0c;包含以.开始的隐藏文件 ls -A 列出除.及..的其它文件 ls -r 反序排列 ls -t 以文件修改时间排序 ls -S 以文件大小排序 ls -h 以易读大小显示 ls -l 除了文件名之外&#xff0c;还将文件的权限、所有者、文件大小等信息详细列出来 …

1856_emacs_calc使用介绍与故事

Grey 全部学习内容汇总&#xff1a; GitHub - GreyZhang/g_org: my learning trip for org-mode 1856_emacs_calc使用介绍与故事 calc是emacs内置的一个计算器&#xff0c;可以提供多种计算表达方式并且可以支持org-mode中的表格功能。 主题由来介绍 我是因为想要了解org-…

设计模式Java向

设计原则&#xff1a; 开闭原则&#xff1a; 用例对象和提供抽象功能进行分割&#xff0c;用例不变&#xff0c;抽象功能被实现&#xff0c;用于不断的扩展&#xff0c;于是源代码不需要进行修改&#xff0c;只在原有基础上进行抽象功能的实现从而进行代码扩展。不变源于代码…

HC-05蓝牙模块--------手机与STM32通信(代码编写)(上位机配置)保姆级教程

⏩ 大家好哇&#xff01;我是小光&#xff0c;嵌入式爱好者&#xff0c;一个想要成为系统架构师的大三学生。 ⏩因为之前无论是电赛还是做项目&#xff0c;都用到了蓝牙模块&#xff0c;如&#xff1a;手机和stm32的通信&#xff0c;电赛中的双车通信&#xff0c;还是遥感小车的…

多线程编程设计模式(单例,阻塞队列,定时器,线程池)

&#x1f495;"只有首先看到事情的可能性&#xff0c;才会有发生的机会。"&#x1f495; 作者&#xff1a;Mylvzi 文章主要内容&#xff1a;多线程编程设计模式(单例,阻塞队列,定时器,线程池) 本文主要讲解多线程编程中常用到的设计模式,包括单例模式,阻塞队列,定时…

DDD系列 - 第8讲 仓库Repository - JPA篇(二)

目录 三、领域层定义仓库Repository接口3.1 ID生成策略3.2 内置方法的使用3.3 关于Specification的使用3.4 通过方法名定义查询3.5 自定义SQL(跨聚合)3.5.1 @NameQuery & @NamedNativeQuery3.5.2 @Query3.5.3 @Query.nativeQuery3.5.4 @Query & @Modifying3.5.5 @Que…