拟对图片型PDF电子书而自动化做思维导图笔记
1、用双层orc识别。
2、根据段落空格两个字段、断句分列等规则,对PDF内容做分类分级,
3、按照层级放入各节点内容内
4、最终导出图片or文档。
断句分列——分类分级规则1:
把每一个自然段作为父节点(首行缩进两个字符)
每一自然段的句号or分号(视为断句分列)作为子节点。
不断细分而衍生孙节点。。。如此类推
断句分列——分类分级规则2
“一、二、三、”作为爷节点,
“(一)(二)(三)”作为父节点,
“1、2、3”作为子节点
“(1)(2)(3)”作为孙节点
so求软件推荐or封装python完整代码(以后仅需替换电子书储存地址即可实现)
以下情形,哪个app能适用于跨渠道平台(ios 9.3.5、Android 4.2.2+、MIUI 11、WIN 7、WIN 10)及多硬件终端(iPad、安卓手机、安卓平板、PC)?
Q1:手写转文本app:用电容笔在iPad手写文字,即时自动转换为电子文本(犹如键盘打出来的字那么工整规范),notability、goodnote、nebo已亲测不得行?
注:ios 9.3.5已经是iPad最高版本,因硬件受限而没法再升级高版本,没法使用系统自带功能,特求平替软件
Q2:分屏app:一边1.5-3倍速播放视频不卡声,一边在PDF文档做批注辅记or画思维导图or记录涂画?
注:ios 9.3.5越狱插件已失,亦没有iPadOS系统自带的前台调度功能;
释义:PDF电子书=影印版图片型PDF=诸多jpg图片而聚合生成的PDF电子书=没法OCR识别
场景:公交地铁,人挤人站着,通勤,纯PDF阅读浏览(无需做笔记)
需求:单手掌持,机器横屏后,能看清PDF电子书的单行全部文字而无需缩放(or尽量不缩放),
Q1、应该选择啥尺寸?可以单手握持机器+手套弹力带
Q2、二手,海鲜市场,预算200-,上述需求,有啥适配机器?
注:最好是型号能新则新,确保使用寿命得长久一丢丢
Q3、这类电子阅读器的电池寿命、屏幕寿命一般多久?
注:据悉主流大厂生产的,电池两三年就已经不得行,要不。。。入手再买全新机器,要不找非官方维保的第三方安装非厂商电池
拟对图片型PDF电子书而自动化做思维导图笔记
1、用双层orc识别。
2、根据段落空格两个字段、断句分列等规则,对PDF内容做分类分级,
3、按照层级放入各节点内容内
4、最终导出图片or文档。
断句分列——分类分级规则1:
把每一个自然段作为父节点(首行缩进两个字符)
每一自然段的句号or分号(视为断句分列)作为子节点。
不断细分而衍生孙节点。。。如此类推
断句分列——分类分级规则2
“一、二、三、”作为爷节点,
“(一)(二)(三)”作为父节点,
“1、2、3”作为子节点
“(1)(2)(3)”作为孙节点
so求软件推荐or封装python完整代码(以后仅需替换电子书储存地址即可实现)
一,求职招聘提及到,职位JD需要SQL经验,指的是MySQL?
二,数据库,SQL与hlive=区别?
二,python第三库pandas和numpy,可否平替MySQL?如果可以,为啥需要齐名兼持(SQL和python)而不单独列举其中一项?
三,python vs r语言 vs MATLAB vs VBA=给金融风控做策略规则与算法建模=有啥区别?如果可以,为啥需要齐名兼持(python,r语言,MATLAB)?
四,r语言vs MATLAB vs VBA=(从上手实操等职场实用性价值而言)学习优先级排序是?各自有啥推荐课程or书籍,尽可能是2023权威出品,求资源
一,刚起步moment,如大佬所言,刷网课自学python及其三件套,然后直接上手实操项目,代码什么的都是Ctrl键➕c和Ctrl键➕v=网上现成=能看懂会改参数,但从零到一原创编写的不会
二,后面有其他大佬建议,原因在于之前囫囵吞枣,应该得回归基础,找几本书看看。。。
三,目前执行中,但书本看过的内容很快就忘,没啥感觉,对python及其第三库规则or参数还是不甚了解。。。
四,本人非系统开发方向,非程序员,但需要python做统计分析、数据挖掘、规则策略和算法建模,so应该咋办?求指导
拟用python做策略建模,包括但不限于:策略规则、算法建模:
一、数据导入
二、数据预处理(清洗规整、增删改查、数据类型转化)
三、探索分析(可视自动化)
四、特征衍生(组合变量批量自动化生成、特征筛选指标评估自动化)
五、分箱筛选(变量分箱最优自动化)
六、相关性构建(多类算法聚合:逻辑、回归、分类&机器学习、深度学习、强化学习
七、检验评测(第六项计算各自的混淆矩阵指标,自动化计算结果)
八、分数转换
九、超参调优
so针对第二至七项,就python及其第三方库(自动化)实操详解的电子书及其代码而言,特跪求大佬推荐。。。非AI或者chatgpt+XX系列,书籍需求具体如下:
1、小白速成上手、简单易懂
because:文科转型
2、行业内公认靠谱,电子书中文版(暂不考虑:单个某库的说明书)
because:内容忒多繁杂,且无常用算法库的聚合呈现
3、需要2023年以后出版
because:即使按书实操,旧版书均因为其所涉之第三方库的灭失、相同操作而新旧版本不适配、新旧版本变更操作等原因而导致无法实现同等功能)
拟对图片型PDF电子书而自动化做思维导图笔记
1、用双层orc识别。
2、根据段落空格两个字段、断句分列等规则,对PDF内容做分类分级,
3、按照层级放入各节点内容内
4、最终导出图片or文档。
断句分列——分类分级规则1:
把每一个自然段作为父节点(首行缩进两个字符)
每一自然段的句号or分号(视为断句分列)作为子节点。
不断细分而衍生孙节点。。。如此类推
断句分列——分类分级规则2
“一、二、三、”作为爷节点,
“(一)(二)(三)”作为父节点,
“1、2、3”作为子节点
“(1)(2)(3)”作为孙节点
so求软件推荐(以后仅需替换电子书储存地址即可实现)
用wps或者office三件套,尤其是excel表单
如选安卓和iPad:性能堪比win,但其鼠标右键的操作逻辑与win完全不同,没法适应
如选chromebook:低配低价,但国内没法联网使用
如选win笔电,高价套娃系列,且内存板载而后期无法手动更换,不适配相关用途(算法建模暨统计分析与数据挖掘=跑代码不卡顿=Python+MySQL+SAS+R+Matlab+SPSS+Tableau=不游戏+不设计+不剪辑视频+不PS;)
如选win台式,满足上述需求,但缺乏便携性,
so应该咋办,求支招
关注数量超出限制,
请先删除部分内容再尝试