Eu tenho dois pandas dataframes assim:
df1
site | link |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteX | https://www.retailer_siteX.com |
df2
site | link |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteY | https://www.retailer_siteY.com |
Então eu quero passar df2 e encontrar instâncias de links de df2 em df1. Aqui está o meu código:
for row in df2['link'].astype(str):
boolean_findings = df1['link'].str.contains(row)
Quando eu impressão boolean_findings, eu estou ficando tudo falso, que eu sei que não pode ser verdade porque eu estou vendo jogos localmente em meus arquivos do excel:
boolean_findings |
---|
Falso |
Falso |
... |
Falso |
O que eu quero saber é por que o hiperlink seqüência de caracteres de texto não está sendo correspondido com a sua equivalente no primeiro df, e o que posso fazer para corresponder os sites.
TypeError: replace() takes no keyword arguments
. Quando eu remover oregex=True
, não é de erro, mas não substituí-lo. Eu acho que eu vou olhar para ore
módulo para resolver isso, mas obrigado por me colocar no caminho certo!