注册 登录
编程论坛 VFP论坛

各位大神,如何用VFP命令提取文本文件的特征数据

qq88881111 发布于 2022-08-30 13:30, 1589 次点击
只有本站会员才能查看附件,请 登录

 <XingMing>张三</XingMing>
  <XingBie>男</XingBie>
  <ChuShengNianYue>199910</ChuShengNianYue>
  <MinZu>汉族</MinZu>
  <JiGuan>广东省广州市</JiGuan>
  <ChuShengDi>广东省广州市</ChuShengDi>
  <RuDangShiJian>202107</RuDangShiJian>
  <CanJiaGongZuoShiJian>202209</CanJiaGongZuoShiJian>
  <JianKangZhuangKuang>健康</JianKangZhuangKuang>
  <ZhuanYeJiShuZhiWu>
  </ZhuanYeJiShuZhiWu>
  <ShuXiZhuanYeYouHeZhuanChang>篮球</ShuXiZhuanYeYouHeZhuanChang>
  <QuanRiZhiJiaoYu_XueLi>大学</QuanRiZhiJiaoYu_XueLi>
  <QuanRiZhiJiaoYu_XueWei>教育学学士</QuanRiZhiJiaoYu_XueWei>
  <QuanRiZhiJiaoYu_XueLi_BiYeYuanXiaoXi>北京师范大学</QuanRiZhiJiaoYu_XueLi_BiYeYuanXiaoXi>
  <QuanRiZhiJiaoYu_XueWei_BiYeYuanXiaoXi>数学与应用数学</QuanRiZhiJiaoYu_XueWei_BiYeYuanXiaoXi>
  <ZaiZhiJiaoYu_XueLi>自考本科</ZaiZhiJiaoYu_XueLi>

我想用VFP命令,从一个文本文件中,提取一个人的简历,生成一个表的一行作为一条数据
我有这样的文本文件 上百条,一条条手动输入太难了,哪位大神帮帮忙?

姓名  性别 出生  民族  出生地 籍贯 入党时间 参工时间 健康状况 特长  全日制学历 全日制学位 简历
张三   男  199910  汉族  ...  ..... ........ .......
11 回复
#2
laowan0012022-08-30 13:35
STREXTRACT(cSearchExpression, cBeginDelim [, cEndDelim [, nOccurrence
[, nFlag]]]])

xstr = filetostr('简历文档.txt')

? STREXTRACT(xstr,'<XingMing>','</XingMing>')
? STREXTRACT(xstr,'<XingBie>','</XingBie>')
#3
qq888811112022-08-30 13:56
提示STREXTRACT.prg不存在
#4
laowan0012022-08-30 14:25
以下是引用qq88881111在2022-8-30 13:56:21的发言:

提示STREXTRACT.prg不存在

你用的不是VFP9吧?
STREXTRACT是个函数
#5
qq888811112022-08-30 14:35
我用的是VFP6 。。。
#6
qq888811112022-08-30 14:35
以下是引用laowan001在2022-8-30 14:25:23的发言:


你用的不是VFP9吧?
STREXTRACT是个函数

我用VFP9 也好像取出的姓名是错误的
#7
sam_jiang2022-08-30 16:12
没问题啊!?
str="<XingMing>张三</XingMing><XingBie>男</XingBie><ChuShengNianYue>199910</ChuShengNianYue><MinZu>汉族</MinZu>"
?STREXTRACT(str,"<XingMing>","</XingMing>")
*主屏幕显示 张三
#8
qq888811112022-08-30 16:25
以下是引用sam_jiang在2022-8-30 16:12:49的发言:

没问题啊!?
str="<XingMing>张三</XingMing><XingBie>男</XingBie><ChuShengNianYue>199910</ChuShengNianYue><MinZu>汉族</MinZu>"
?STREXTRACT(str,"<XingMing>","</XingMing>")
*主屏幕显示 张三

文本文档的编码改为ANSI 就可以
#9
laowan0012022-08-31 09:14
以下是引用qq88881111在2022-8-30 14:35:59的发言:


我用VFP9 也好像取出的姓名是错误的

什么样的错误?发上来好分析问题
#10
zhken2022-09-01 22:22
可以根据每行<>规律 ,将其<>内的字串检测并删除,留下需要的字符就好
#11
laowan0012022-09-02 08:12
特征字符是固定的,而且是可以穷举的,可以循环这些特征字符,把内容取出来
#12
sdta2024-03-07 13:35
VFP6字符串处理函数:alines(),substr()+at()
1