题目内容
(请给出正确答案)
[主观题]
汉字国标码是一个字符编码库,其中包含了6763个汉字以及682个其他基本图形字符,共计7445个字符。这6763个汉字基本可以覆盖中文的日常使用。对于不在6763中的生僻字,如果没有额外附加的字库,则无法正常显示。()
A、对
B、错
答案
查看答案
A、对
B、错
第1题
A.每个汉字有一个八进制编码,叫汉字国标码
B.汉字输入码、ASCII码都是汉字的编码形式
C.在我国汉字代码标准GB2312-80中规定每个汉字使用2个字节
D.国标码就是区位码
第4题
A.字符的ASCII码是7位编码
B.在用一个汉字系统中,用不同输入法输入同一汉字,其机内码是一 样的
C.二进制很容易转换为八进制或者十六进制
D.汉字在计算机内是按照其字型编码处理的
第8题
A.Jieba专注于中文分词操作
B.NLTK主要用于一般自然语言处理任务(标记化,POS标记,解析等)
C.Gensim主要用于题和向量空间建模、文档集合相似性等
D.Scikit-learn为机器学习提供了一个大型库,其中包含了用于文本预处理的工具,例如词频-逆文档频率特征提取(TfidfVectorizer)等。
第9题
A.在计算机内部汉字编码采用ASCII码
B.计算机的汉字编码有输入码、机内码、国标码、输出码
C.汉字在计算机内部以十进制进行编码
D.汉字编码太过复杂,应该用拼音代替汉字