有的没的
这几天做专业介绍的 ppt,苦于把 ppt 转为 md。
之前都是用 ppt 保存为 pdf,然后在https://pdf2md.morethan.io/ 转换为 md
今上午试了一下微软的 markitdown 这个 python 库,发现还阔以。直接 markitdown file -o output.md
#programming #ai
之前都是用 ppt 保存为 pdf,然后在https://pdf2md.morethan.io/ 转换为 md
今上午试了一下微软的 markitdown 这个 python 库,发现还阔以。直接 markitdown file -o output.md
#programming #ai
今天实践了手动 rag,提取相关文档的内容加入到 prompt 里面。
pdf 转 md 使用了https://pdf2md.morethan.io/
然后 md 中写明白引用的章节。
一般就是 三个### 加上材料的名字,比如:
引用的时候,使用[文字](#章节名字)来引用,比如
这样,按住cmd再点击就跳转到相应位置了。
可能不这么引用,llm也会自己找到···这么做确实有点麻烦,但是更精确吧。
#programming #ai
pdf 转 md 使用了https://pdf2md.morethan.io/
然后 md 中写明白引用的章节。
一般就是 三个### 加上材料的名字,比如:
### 学院信息
引用的时候,使用[文字](#章节名字)来引用,比如
[学院介绍](#学院信息)
这样,按住cmd再点击就跳转到相应位置了。
可能不这么引用,llm也会自己找到···这么做确实有点麻烦,但是更精确吧。
#programming #ai
今天又探索出了一个,让 llm 更好的和 python docx 库联动的方法。
写了一个脚本,这个脚本可以列出 docx文件里表格的每个单元格的 index 还有内容。
把这个运行后的结果,粘贴在 prompt 中,这样成功率很高。
查看 docx repo 中的docx_inspectTable0.py
#programming
写了一个脚本,这个脚本可以列出 docx文件里表格的每个单元格的 index 还有内容。
把这个运行后的结果,粘贴在 prompt 中,这样成功率很高。
查看 docx repo 中的docx_inspectTable0.py
#programming
没事儿在b站看高天的直播
其实只不过就是高天在不断的回答网友们提出的问题
发现开成只播放声音,然后加小窗,然后关上屏幕默默的当收音机听,效果也不错
其中学习到了一个比较好的一个观点
就是如果不能确定AI写的内容的正确性,那么就不应该用AI.
成功的使用AI是作为一种辅助,而且能看得懂他写的是啥
#programming
其实只不过就是高天在不断的回答网友们提出的问题
发现开成只播放声音,然后加小窗,然后关上屏幕默默的当收音机听,效果也不错
其中学习到了一个比较好的一个观点
就是如果不能确定AI写的内容的正确性,那么就不应该用AI.
成功的使用AI是作为一种辅助,而且能看得懂他写的是啥
#programming
docker镜像地址总结:
https://www.wangdu.site/course/2109.html
最简单的办法,是在compose.yml或者镜像名字前面加上镜像网址
比如:
#programming
https://www.wangdu.site/course/2109.html
最简单的办法,是在compose.yml或者镜像名字前面加上镜像网址
比如:
docker pull docker.1ms.run/whyyour/qinglong:debian
#programming
vercel cli比wrangler好用多了!!
直接cd到项目目录,执行vercel就行。
根据引导登录之后,就自动部署了。
以后更新项目,直接执行vercel —prod,超级简单!!
——-
吐槽一下,原本是想在青龙爬完kb之后,cd到目录运行vercel —prod,但是老是报多个参数,不知道青龙执行的时候自动带了什么参数。
最后还是直接在py源代码里面用os.system执行了。
#programming
直接cd到项目目录,执行vercel就行。
根据引导登录之后,就自动部署了。
以后更新项目,直接执行vercel —prod,超级简单!!
——-
吐槽一下,原本是想在青龙爬完kb之后,cd到目录运行vercel —prod,但是老是报多个参数,不知道青龙执行的时候自动带了什么参数。
最后还是直接在py源代码里面用os.system执行了。
#programming
今天看了两个关于没有xwindow环境的linux如何进行wifi认证的方法:
1. 使用w3m lynx link2 brow.sh之类的的命令行浏览器
2. 使用playwright写个脚本
很完美 我都要试试
Ps:已经测试了browsh 太牛逼啦!
#programming
1. 使用w3m lynx link2 brow.sh之类的的命令行浏览器
2. 使用playwright写个脚本
很完美 我都要试试
Ps:已经测试了browsh 太牛逼啦!
#programming
#programming
最近的几个playwright工程表明,iFrame才是最大的阻碍。但是也好解决。
iFrame就是一个网页中的网页。
那么使用playwright的时候,需要使用pw.frame_locator方法把这个frame拿出来之后,再使用普通的Locator方法进行xpath定位。
注意,chrome中对iFrame中的元素提取的xpath,就需要在playwright剥离好iFrame之后的下一层使用。要不会找不到。
比如上面的iFrame里面一个表格的xpath,就是chrome直接提取到的xpath。
最近的几个playwright工程表明,iFrame才是最大的阻碍。但是也好解决。
iFrame就是一个网页中的网页。
那么使用playwright的时候,需要使用pw.frame_locator方法把这个frame拿出来之后,再使用普通的Locator方法进行xpath定位。
frame = page.frame_locator('xpath=/html/body/div[1]/div[3]/div[1]/div/div[2]/iframe')
frame.locator('//*[@id="t1"]').wait_for()
注意,chrome中对iFrame中的元素提取的xpath,就需要在playwright剥离好iFrame之后的下一层使用。要不会找不到。
比如上面的iFrame里面一个表格的xpath,就是chrome直接提取到的xpath。
最近处理表格也多了,最开始是因为1+X劳务费的表格
还得是xlookup,大魔王般的函数。
其中有个小技巧,就是如果不想让自动编号,就再某个单元格编号前面加个dollar sign. 比如 A$3, 那么进行批量填充的时候,这个第三行是不会被自动编号的。
#programming
还得是xlookup,大魔王般的函数。
其中有个小技巧,就是如果不想让自动编号,就再某个单元格编号前面加个dollar sign. 比如 A$3, 那么进行批量填充的时候,这个第三行是不会被自动编号的。
#programming
今天探索到了一个新的网页自动化的路径。
就是可以再devtool里,选中某个或者某些元素,然后右键copy element,然后给AI,然后就可以说需求。
比如毕业实习校网的日志批阅表格,我就把这个表格这个element给copy了一下,然后给ai当做context。
发现了devtool里有AI assistance,但是提示我的地区不支持。不知道是否可以直接用这个assitance进行playwright的代码输出
#programming
就是可以再devtool里,选中某个或者某些元素,然后右键copy element,然后给AI,然后就可以说需求。
比如毕业实习校网的日志批阅表格,我就把这个表格这个element给copy了一下,然后给ai当做context。
发现了devtool里有AI assistance,但是提示我的地区不支持。不知道是否可以直接用这个assitance进行playwright的代码输出
#programming