有的没的
这几天做专业介绍的 ppt,苦于把 ppt 转为 md。

之前都是用 ppt 保存为 pdf,然后在https://pdf2md.morethan.io/ 转换为 md

今上午试了一下微软的 markitdown 这个 python 库,发现还阔以。直接 markitdown file -o output.md

#programming #ai GitHub - microsoft/markitdown: Python tool for converting files and office documents to Markdown.
今天实践了手动 rag,提取相关文档的内容加入到 prompt 里面。

pdf 转 md 使用了https://pdf2md.morethan.io/

然后 md 中写明白引用的章节。

一般就是 三个### 加上材料的名字,比如:
### 学院信息


引用的时候,使用[文字](#章节名字)来引用,比如
[学院介绍](#学院信息)

这样,按住cmd再点击就跳转到相应位置了。

可能不这么引用,llm也会自己找到···这么做确实有点麻烦,但是更精确吧。


#programming #ai
今天又探索出了一个,让 llm 更好的和 python docx 库联动的方法。

写了一个脚本,这个脚本可以列出 docx文件里表格的每个单元格的 index 还有内容。

把这个运行后的结果,粘贴在 prompt 中,这样成功率很高。

查看 docx repo 中的docx_inspectTable0.py

#programming
没事儿在b站看高天的直播
其实只不过就是高天在不断的回答网友们提出的问题
发现开成只播放声音,然后加小窗,然后关上屏幕默默的当收音机听,效果也不错

其中学习到了一个比较好的一个观点

就是如果不能确定AI写的内容的正确性,那么就不应该用AI.

成功的使用AI是作为一种辅助,而且能看得懂他写的是啥

#programming
vercel cli比wrangler好用多了!!

直接cd到项目目录,执行vercel就行。

根据引导登录之后,就自动部署了。

以后更新项目,直接执行vercel —prod,超级简单!!


——-
吐槽一下,原本是想在青龙爬完kb之后,cd到目录运行vercel —prod,但是老是报多个参数,不知道青龙执行的时候自动带了什么参数。

最后还是直接在py源代码里面用os.system执行了。


#programming
今天看了两个关于没有xwindow环境的linux如何进行wifi认证的方法:
1. 使用w3m lynx link2 brow.sh之类的的命令行浏览器
2. 使用playwright写个脚本

很完美 我都要试试


Ps:已经测试了browsh 太牛逼啦!

#programming
OliveTin: 脚本命令面板

一个简单粗暴的面板

如图所示

可能还是有点实用的

😘 OliveTin

🧐 频道资源合集 😄 恰饭推荐 💬 群组

#programming
下了cursor玩了玩 竟然没经过我允许就把我默认的VSCode替代作为默认应用了 果断卸载

看了一下 主要的功能是composer,还有代码选中对话

好像github copilot也能替代 还是继续用github copilot吧

两则cursor视频 来自 秋芝2046 这个up主还可以

#ai #programming
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
#programming

最近的几个playwright工程表明,iFrame才是最大的阻碍。但是也好解决。

iFrame就是一个网页中的网页。

那么使用playwright的时候,需要使用pw.frame_locator方法把这个frame拿出来之后,再使用普通的Locator方法进行xpath定位。
frame = page.frame_locator('xpath=/html/body/div[1]/div[3]/div[1]/div/div[2]/iframe')

frame.locator('//*[@id="t1"]').wait_for()

注意,chrome中对iFrame中的元素提取的xpath,就需要在playwright剥离好iFrame之后的下一层使用。要不会找不到。
比如上面的iFrame里面一个表格的xpath,就是chrome直接提取到的xpath。
最近处理表格也多了,最开始是因为1+X劳务费的表格
还得是xlookup,大魔王般的函数。
其中有个小技巧,就是如果不想让自动编号,就再某个单元格编号前面加个dollar sign. 比如 A$3, 那么进行批量填充的时候,这个第三行是不会被自动编号的。

#programming
今天探索到了一个新的网页自动化的路径。
就是可以再devtool里,选中某个或者某些元素,然后右键copy element,然后给AI,然后就可以说需求。

比如毕业实习校网的日志批阅表格,我就把这个表格这个element给copy了一下,然后给ai当做context。

发现了devtool里有AI assistance,但是提示我的地区不支持。不知道是否可以直接用这个assitance进行playwright的代码输出

#programming
md 学校zhkt网站每晚10:30关闭,第二天6:30开启,这整的cookie直接失效了 唉有啥解决办法

#programming
 
 
Back to Top